Python Pandas系列显示相同值的唯一方法

Python Pandas系列显示相同值的唯一方法,python,pandas,series,Python,Pandas,Series,我有一个熊猫数据框。当我对其中一列运行.unique()方法时,它会显示看起来相同的值。我如何才能看到这些值的差异?我试图从unique()方法建立索引,但值只是如下所示的字符串。谢谢你的帮助 df["MyColumn"].unique() array(['yi̇', 'yd', 'yi'], dtype=object) _______________________________________ df["MyColumn"].unique()[0] 'yi̇' _______________

我有一个熊猫数据框。当我对其中一列运行.unique()方法时,它会显示看起来相同的值。我如何才能看到这些值的差异?我试图从unique()方法建立索引,但值只是如下所示的字符串。谢谢你的帮助

df["MyColumn"].unique()
array(['yi̇', 'yd', 'yi'], dtype=object)
_______________________________________
df["MyColumn"].unique()[0]
'yi̇'
_______________________________________
df["MyColumn"].unique()[2]
'yi̇'


仔细观察,您会发现不同之处:

'yi̇' # the i letter has two dots
'yi' # normal i letter

因此,您似乎看到了两个不同的unicode字符,但它们看起来非常相似。

仔细观察,您会发现它们的区别:

'yi̇' # the i letter has two dots
'yi' # normal i letter

因此,您似乎看到了两个不同的unicode字符,但它们看起来非常相似。

您可以检查asci代码有什么区别,这里在第一个
i
之后是特殊值
775
,如注释中所示:


您可以检查asci代码有什么区别,这里在第一个
i
之后是特殊值
775
如注释中所示:


也许您可以过滤数据帧,
df[df[“MyColumn”]==df[“MyColumn”].unique()[2]
df[df[“MyColumn”]==df[“MyColumn”].unique()[0]
它不是字母字符“i”,而是不同的unicode字符长度为2
[len(i)表示['i̇','d','i']]
返回
[2,1,1]
也许您可以过滤数据帧,
df[df[“MyColumn”]==df[“MyColumn”].unique()[2]
df[df[“MyColumn”]==df[“MyColumn”].unique()[0]
它不是字母字符“i”,而是不同的unicode字符长度为2
[len(i)表示['i'、'd'、'i']
返回
[2、1、1]