Python Pandas系列显示相同值的唯一方法_Python_Pandas_Series

Python Pandas系列显示相同值的唯一方法

python pandas

Python Pandas系列显示相同值的唯一方法,python,pandas,series,Python,Pandas,Series,我有一个熊猫数据框。当我对其中一列运行.unique（）方法时，它会显示看起来相同的值。我如何才能看到这些值的差异？我试图从unique（）方法建立索引，但值只是如下所示的字符串。谢谢你的帮助 df["MyColumn"].unique() array(['yi̇', 'yd', 'yi'], dtype=object) _______________________________________ df["MyColumn"].unique()[0] 'yi̇' _______________

我有一个熊猫数据框。当我对其中一列运行.unique（）方法时，它会显示看起来相同的值。我如何才能看到这些值的差异？我试图从unique（）方法建立索引，但值只是如下所示的字符串。谢谢你的帮助

df["MyColumn"].unique()
array(['yi̇', 'yd', 'yi'], dtype=object)
_______________________________________
df["MyColumn"].unique()[0]
'yi̇'
_______________________________________
df["MyColumn"].unique()[2]
'yi̇'

仔细观察，您会发现不同之处：

'yi̇' # the i letter has two dots
'yi' # normal i letter

因此，您似乎看到了两个不同的unicode字符，但它们看起来非常相似。

仔细观察，您会发现它们的区别：

'yi̇' # the i letter has two dots
'yi' # normal i letter

因此，您似乎看到了两个不同的unicode字符，但它们看起来非常相似。

您可以检查asci代码有什么区别，这里在第一个

之后是特殊值

，如注释中所示：

您可以检查asci代码有什么区别，这里在第一个

之后是特殊值

如注释中所示：

也许您可以过滤数据帧，

df[df[“MyColumn”]==df[“MyColumn”].unique（）[2]

和

df[df[“MyColumn”]==df[“MyColumn”].unique（）[0]

它不是字母字符“i”，而是不同的unicode字符长度为2

[len（i）表示['i̇'，'d'，'i']]

[2,1,1]

也许您可以过滤数据帧，

df[df[“MyColumn”]==df[“MyColumn”].unique（）[2]

和

df[df[“MyColumn”]==df[“MyColumn”].unique（）[0]

它不是字母字符“i”，而是不同的unicode字符长度为2

[len（i）表示['i'、'd'、'i']

[2、1、1]