Excel列中的唯一值,行中不缺少信息-Python
目前正在自学Python并遇到一些问题。我的挑战要求我在excel电子表格的列中计算唯一值的数量,其中的行没有缺失值。以下是迄今为止我所得到的,但我似乎无法让它发挥作用:Excel列中的唯一值,行中不缺少信息-Python,python,excel,pandas,dataframe,multiple-columns,Python,Excel,Pandas,Dataframe,Multiple Columns,目前正在自学Python并遇到一些问题。我的挑战要求我在excel电子表格的列中计算唯一值的数量,其中的行没有缺失值。以下是迄今为止我所得到的,但我似乎无法让它发挥作用: import xlrd import pandas as pd workbook = xlrd.open_workbook("*name of excel spreadsheet*") worksheet = workbook.sheet_by_name("*name of specific sheet*") pd.v
import xlrd
import pandas as pd
workbook = xlrd.open_workbook("*name of excel spreadsheet*")
worksheet = workbook.sheet_by_name("*name of specific sheet*")
pd.value_counts(df.*name of specific column*)
s = pd.value_counts(df.*name of specific column*)
s1 = pd.Series({'nunique': len(s), 'unique values': s.index.tolist()})
s.append(s1)
print(s)
提前感谢您的帮助。使用内置的在列中查找唯一的: 与您分享一个示例:
import pandas as pd
df=pd.DataFrame(columns=["a","b"])
df["a"]=[1,3,3,3,4]
df["b"]=[1,2,2,3,4]
print(df["a"].unique())
将给出以下结果:
[1 3 4]
因此,如果愿意,您可以将其存储为变量的列表,使用:
l_of_unique_vals=df["a"].unique()
找到它的长度或者做任何你喜欢的事情
df = pd.read_excel("nameoffile.xlsx", sheet_name=name_of_sheet_you_are_loading)
#in the line above we are reading the file in a pandas dataframe and giving it a name df
df["column you want to find vals from"].unique()
首先,您可以使用Pandasread_exel
,然后使用unique
,如@Inder建议的
import pandas as pd
df = pd.read_exel('name_of_your_file.xlsx')
print(df['columns'].unique())
请参阅更多。谢谢您的评论。在本例中,如何将excel列定义为df?在您的示例中,您正在模块中创建数据框。您可以在数据框中打开excel。让我在我的回答中演示一下,编辑它以包含您的问题code@BenSmert列的名称将与exel文件中的名称相同,但如果您希望查看数据和列,则始终可以使用
print(df)