Python 熊猫:在CSV文件上使用整个字符串作为分隔符
在我的CSV文件中,每一行都用分隔符Python 熊猫:在CSV文件上使用整个字符串作为分隔符,python,regex,pandas,Python,Regex,Pandas,在我的CSV文件中,每一行都用分隔符“$$$字段$$$”(简单字符串,不是正则表达式)分隔。我试图执行以下操作,但忽略了分隔符 df = pd.read_csv('filename.csv', sep='\b$$$Field$$$\b') 有什么想法吗?看来你需要通过\来逃避$: import pandas as pd from pandas.compat import StringIO temp=u"""Food$$$Field$$$Taste Apple$$$Field$$$a Bana
“$$$字段$$$”
(简单字符串,不是正则表达式)分隔。我试图执行以下操作,但忽略了分隔符
df = pd.read_csv('filename.csv', sep='\b$$$Field$$$\b')
有什么想法吗?看来你需要通过
\
来逃避$
:
import pandas as pd
from pandas.compat import StringIO
temp=u"""Food$$$Field$$$Taste
Apple$$$Field$$$a
Banana$$$Field$$$b"""
#after testing replace 'StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp), sep='\$\$\$Field\$\$\$',engine='python')
print (df)
Food Taste
0 Apple a
1 Banana b
文件:
九月
:str,默认为“,”表示读取csv(),\t表示读取表格()
要使用的分隔符。如果sep为“无”,将尝试自动确定该值长度大于1个字符且与“\s+”不同的分隔符将被解释为正则表达式,将强制使用python解析引擎,并将忽略数据中的引号。正则表达式示例:'\r\t'
似乎您需要通过
\
转义$
:
import pandas as pd
from pandas.compat import StringIO
temp=u"""Food$$$Field$$$Taste
Apple$$$Field$$$a
Banana$$$Field$$$b"""
#after testing replace 'StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp), sep='\$\$\$Field\$\$\$',engine='python')
print (df)
Food Taste
0 Apple a
1 Banana b
文件:
九月
:str,默认为“,”表示读取csv(),\t表示读取表格()
要使用的分隔符。如果sep为“无”,将尝试自动确定该值长度大于1个字符且与“\s+”不同的分隔符将被解释为正则表达式,将强制使用python解析引擎,并将忽略数据中的引号。正则表达式示例:'\r\t'
它忽略了分隔符,所以它会自动确定(并选择错误的一个,一个选项卡)
sep=\b$$$$Field$$$\b
它不是有效的python代码。它忽略了分隔符,所以它会自动确定(并选择错误的一个,一个选项卡)sep=\b$$$Field$$\b
它不是有效的python代码。