Python 返回与系列中的某些日语字符匹配的行
我有一个pandas数据框,有几列日语。 我想运行一个搜索,返回包含某些日语字符的行 前 我知道我不能只使用这样的东西:Python 返回与系列中的某些日语字符匹配的行,python,pandas,character-encoding,Python,Pandas,Character Encoding,我有一个pandas数据框,有几列日语。 我想运行一个搜索,返回包含某些日语字符的行 前 我知道我不能只使用这样的东西: df[df.col1.str.contains(find_str)] or df[df.col1 == find_str] 我该怎么办?比如我需要使用什么编码,等等 name 0 ヴァラ
df[df.col1.str.contains(find_str)] or df[df.col1 == find_str]
我该怎么办?比如我需要使用什么编码,等等
name
0 ヴァラ
1 ALEXANDER WANG(アレキサンダーワン) クラッチバッグ パイソン【中古】
2 ミューズトゥ
3 ミューズトゥ
4 ローディーロック
5 バブーシュカクリスタルGG
我会做一些简单的事情,比如:
df[df.name.str.contains('ゥ')]
它应该返回第2行和第3行,但我得到的结果却是空的
#!/usr/bin/python
# -*- coding: utf-8 -*-
import pandas as pd
df = pd.read_csv('file.csv', encoding='utf-8')
find_str = u'バッグ'
m = df['name'].str.contains(find_str)
print (m)
0 False
1 True
2 False
3 False
4 False
5 False
Name: name, dtype: bool
对于我的工作:
#!/usr/bin/python
# -*- coding: utf-8 -*-
import pandas as pd
df = pd.read_csv('file.csv', encoding='utf-8')
find_str = u'バッグ'
m = df['name'].str.contains(find_str)
print (m)
0 False
1 True
2 False
3 False
4 False
5 False
Name: name, dtype: bool
需要df[df.col1.str.containsfind_str | df.col1==find_str]您使用的是python2还是Python3?我使用的是python2.7需要df[df.col1.str.containsfind_str | df.col1==find_str]您使用的是python2还是3?我使用的是python2.7在一个空数据框中运行这样的查询,为meCan添加一些示例?4,5行运行这样的查询会导致Mec的数据框为空。您可以添加一些示例吗?4,5行