Python 3.x 获取dataframe列中元素出现的所有不同类型的模式
我的数据集只包含一列。我需要找出的是数据在特定列中排列的所有模式 我尝试使用Python 3.x 获取dataframe列中元素出现的所有不同类型的模式,python-3.x,pandas,duplicates,Python 3.x,Pandas,Duplicates,我的数据集只包含一列。我需要找出的是数据在特定列中排列的所有模式 我尝试使用pd.duplicated()函数做一些事情。但它没有给出正确的结果 例如: 数据集: Column A [1,2,3,1,2,3,4,1,2,3,1,2,3,4] 所需结果应为[1,2,3],[1,2,3,4],[1,2],[3,1,2]等 无论Python中的任何包如何,都可以获得解决方案。一个好的老式双循环并不优雅,但可以工作: 我添加为元组,以便使用set(…)删除重复项 ls = [1,2,3,1,2,3,4
pd.duplicated()
函数做一些事情。但它没有给出正确的结果
例如:
数据集:
Column A
[1,2,3,1,2,3,4,1,2,3,1,2,3,4]
所需结果应为[1,2,3]
,[1,2,3,4]
,[1,2],[3,1,2]等
无论Python中的任何包如何,都可以获得解决方案。一个好的老式双循环并不优雅,但可以工作: 我添加为元组,以便使用
set(…)
删除重复项
ls = [1,2,3,1,2,3,4,1,2,3,1,2,3,4]
set([tuple(ls[i:j+1]) for i in range(len(ls)) for j in range(i, len(ls))])
输出
{(1,),
(1, 2),
(1, 2, 3),
(1, 2, 3, 1),
(1, 2, 3, 1, 2),
(1, 2, 3, 1, 2, 3),
(1, 2, 3, 1, 2, 3, 4),
(1, 2, 3, 1, 2, 3, 4, 1),
(1, 2, 3, 1, 2, 3, 4, 1, 2),
(1, 2, 3, 1, 2, 3, 4, 1, 2, 3),
(1, 2, 3, 1, 2, 3, 4, 1, 2, 3, 1),
(1, 2, 3, 1, 2, 3, 4, 1, 2, 3, 1, 2),
(1, 2, 3, 1, 2, 3, 4, 1, 2, 3, 1, 2, 3),
(1, 2, 3, 1, 2, 3, 4, 1, 2, 3, 1, 2, 3, 4),
(1, 2, 3, 4),
(1, 2, 3, 4, 1),
(1, 2, 3, 4, 1, 2),
(1, 2, 3, 4, 1, 2, 3),
(1, 2, 3, 4, 1, 2, 3, 1),
(1, 2, 3, 4, 1, 2, 3, 1, 2),
(1, 2, 3, 4, 1, 2, 3, 1, 2, 3),
(1, 2, 3, 4, 1, 2, 3, 1, 2, 3, 4),
(2,),
(2, 3),
(2, 3, 1),
(2, 3, 1, 2),
(2, 3, 1, 2, 3),
(2, 3, 1, 2, 3, 4),
(2, 3, 1, 2, 3, 4, 1),
(2, 3, 1, 2, 3, 4, 1, 2),
(2, 3, 1, 2, 3, 4, 1, 2, 3),
(2, 3, 1, 2, 3, 4, 1, 2, 3, 1),
(2, 3, 1, 2, 3, 4, 1, 2, 3, 1, 2),
(2, 3, 1, 2, 3, 4, 1, 2, 3, 1, 2, 3),
(2, 3, 1, 2, 3, 4, 1, 2, 3, 1, 2, 3, 4),
(2, 3, 4),
(2, 3, 4, 1),
(2, 3, 4, 1, 2),
(2, 3, 4, 1, 2, 3),
(2, 3, 4, 1, 2, 3, 1),
(2, 3, 4, 1, 2, 3, 1, 2),
(2, 3, 4, 1, 2, 3, 1, 2, 3),
(2, 3, 4, 1, 2, 3, 1, 2, 3, 4),
(3,),
(3, 1),
(3, 1, 2),
(3, 1, 2, 3),
(3, 1, 2, 3, 4),
(3, 1, 2, 3, 4, 1),
(3, 1, 2, 3, 4, 1, 2),
(3, 1, 2, 3, 4, 1, 2, 3),
(3, 1, 2, 3, 4, 1, 2, 3, 1),
(3, 1, 2, 3, 4, 1, 2, 3, 1, 2),
(3, 1, 2, 3, 4, 1, 2, 3, 1, 2, 3),
(3, 1, 2, 3, 4, 1, 2, 3, 1, 2, 3, 4),
(3, 4),
(3, 4, 1),
(3, 4, 1, 2),
(3, 4, 1, 2, 3),
(3, 4, 1, 2, 3, 1),
(3, 4, 1, 2, 3, 1, 2),
(3, 4, 1, 2, 3, 1, 2, 3),
(3, 4, 1, 2, 3, 1, 2, 3, 4),
(4,),
(4, 1),
(4, 1, 2),
(4, 1, 2, 3),
(4, 1, 2, 3, 1),
(4, 1, 2, 3, 1, 2),
(4, 1, 2, 3, 1, 2, 3),
(4, 1, 2, 3, 1, 2, 3, 4)}
你如何定义“模式”?例如,为什么您的模式不是
[1,2]
,[3,1,2]
和[3,4]
对不起,我不清楚。我需要所有的模式,包括你指出的模式。