Python pandas中multipel列的唯一值

Python pandas中multipel列的唯一值,python,python-3.x,pandas,Python,Python 3.x,Pandas,但是如果我不知道列的名称呢 我认为您需要: distinct_values = df.col_name.unique().compute() 输出: df = pd.DataFrame({"colA":['a', 'b', 'b', 'd', 'e'], "colB":[1,2,1,2,1]}) unique_dict = {} # df.columns will give you list of columns in dataframe for col in df.columns:

但是如果我不知道列的名称呢

我认为您需要:

distinct_values = df.col_name.unique().compute()
输出:

df = pd.DataFrame({"colA":['a', 'b', 'b', 'd', 'e'], "colB":[1,2,1,2,1]})

unique_dict = {}

# df.columns will give you list of columns in dataframe
for col in df.columns:
    unique_dict[col] = list(df[col].unique())
你可以试试这个

>>将熊猫作为pd导入
>>>df=pd.DataFrame({'a':[1,2,3],'b':[2,3,5]})
>>>d=dict()
>>>d['any_column_name']=pd.unique(df.values.ravel('K'))
>>>d
{'any_column_name':数组([1,2,3,5])}
或者只是一个功能

>d=dict()
>>>d['a']=df['a'].unique()
>>>d
{'a':数组([1,2,3])}
或者说,对所有人来说

>d=dict()
>>>对于df.列中的列:
...     d[col]=df[col].unique()
...
>>>d
{'a':数组([1,2,3]),'b':数组([2,3,5])}

是否希望所有列或列的子集具有唯一值?所有列显示以下错误raise AttributeError(“'DataFrame'对象没有属性%r”%key)AttributeError:“DataFrame”对象没有“unique”属性,或者如果我只需要一列中的唯一值,但我不知道列名,请添加示例数据和预期输出。谢谢,但是如果我只需要一列中的唯一值,那么您应该知道列名,并且可以通过键访问上述词典。例如,
unique_dict[“colA”]
unique_dict={}用于df.columns:distinct_values=df.[col].unique().compute()为什么不工作?
df.[col].unique()中的df之后有额外的
。它应该是
df[col].unique()
,我不确定
compute
方法做什么
{'colA': ['a', 'b', 'd', 'e'], 'colB': [1, 2]}