Python 熊猫：在CSV文件上使用整个字符串作为分隔符_Python_Regex_Pandas

Python 熊猫：在CSV文件上使用整个字符串作为分隔符

python regex pandas

Python 熊猫：在CSV文件上使用整个字符串作为分隔符,python,regex,pandas,Python,Regex,Pandas,在我的CSV文件中，每一行都用分隔符“$$$字段$$$”（简单字符串，不是正则表达式）分隔。我试图执行以下操作，但忽略了分隔符 df = pd.read_csv('filename.csv', sep='\b$$$Field$$$\b') 有什么想法吗？看来你需要通过\来逃避$： import pandas as pd from pandas.compat import StringIO temp=u"""Food$$$Field$$$Taste Apple$$$Field$$$a Bana

在我的CSV文件中，每一行都用分隔符

“$$$字段$$$”

（简单字符串，不是正则表达式）分隔。我试图执行以下操作，但忽略了分隔符

df = pd.read_csv('filename.csv', sep='\b$$$Field$$$\b')

有什么想法吗？

看来你需要通过

来逃避

：

import pandas as pd
from pandas.compat import StringIO

temp=u"""Food$$$Field$$$Taste
Apple$$$Field$$$a
Banana$$$Field$$$b"""
#after testing replace 'StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp), sep='\$\$\$Field\$\$\$',engine='python')
print (df)
     Food Taste
0   Apple     a
1  Banana     b

文件：

九月

：str，默认为“，”表示读取csv（），\t表示读取表格（）

要使用的分隔符。如果sep为“无”，将尝试自动确定该值长度大于1个字符且与“\s+”不同的分隔符将被解释为正则表达式，将强制使用python解析引擎，并将忽略数据中的引号。正则表达式示例：'\r\t'

似乎您需要通过

转义

：

import pandas as pd
from pandas.compat import StringIO

temp=u"""Food$$$Field$$$Taste
Apple$$$Field$$$a
Banana$$$Field$$$b"""
#after testing replace 'StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp), sep='\$\$\$Field\$\$\$',engine='python')
print (df)
     Food Taste
0   Apple     a
1  Banana     b

文件：

九月

：str，默认为“，”表示读取csv（），\t表示读取表格（）

它忽略了分隔符，所以它会自动确定（并选择错误的一个，一个选项卡）

sep=\b$$$$Field$$$\b

它不是有效的python代码。它忽略了分隔符，所以它会自动确定（并选择错误的一个，一个选项卡）

sep=\b$$$Field$$\b

它不是有效的python代码。