Python Pandas系列显示相同值的唯一方法
我有一个熊猫数据框。当我对其中一列运行.unique()方法时,它会显示看起来相同的值。我如何才能看到这些值的差异?我试图从unique()方法建立索引,但值只是如下所示的字符串。谢谢你的帮助Python Pandas系列显示相同值的唯一方法,python,pandas,series,Python,Pandas,Series,我有一个熊猫数据框。当我对其中一列运行.unique()方法时,它会显示看起来相同的值。我如何才能看到这些值的差异?我试图从unique()方法建立索引,但值只是如下所示的字符串。谢谢你的帮助 df["MyColumn"].unique() array(['yi̇', 'yd', 'yi'], dtype=object) _______________________________________ df["MyColumn"].unique()[0] 'yi̇' _______________
df["MyColumn"].unique()
array(['yi̇', 'yd', 'yi'], dtype=object)
_______________________________________
df["MyColumn"].unique()[0]
'yi̇'
_______________________________________
df["MyColumn"].unique()[2]
'yi̇'
仔细观察,您会发现不同之处:
'yi̇' # the i letter has two dots
'yi' # normal i letter
因此,您似乎看到了两个不同的unicode字符,但它们看起来非常相似。仔细观察,您会发现它们的区别:
'yi̇' # the i letter has two dots
'yi' # normal i letter
因此,您似乎看到了两个不同的unicode字符,但它们看起来非常相似。您可以检查asci代码有什么区别,这里在第一个
i
之后是特殊值775
,如注释中所示:
您可以检查asci代码有什么区别,这里在第一个
i
之后是特殊值775
如注释中所示:
也许您可以过滤数据帧,
df[df[“MyColumn”]==df[“MyColumn”].unique()[2]
和df[df[“MyColumn”]==df[“MyColumn”].unique()[0]
它不是字母字符“i”,而是不同的unicode字符长度为2[len(i)表示['i̇','d','i']]
返回[2,1,1]
也许您可以过滤数据帧,df[df[“MyColumn”]==df[“MyColumn”].unique()[2]
和df[df[“MyColumn”]==df[“MyColumn”].unique()[0]
它不是字母字符“i”,而是不同的unicode字符长度为2[len(i)表示['i'、'd'、'i']
返回[2、1、1]