Python 熊猫阅读如何处理括号中的sep字符

Python 熊猫阅读如何处理括号中的sep字符,python,pandas,dataframe,delimiter,Python,Pandas,Dataframe,Delimiter,我有这样的原始文件,大约有20k列,类似于: number|colour|(a|1)|animal 1|green|x|dog 2|blue|y|cat 3|red|z|owl 当我使用read_csv('raw.csv',sep='|')时,会创建一个带有额外列的数据帧,因为(a | 1)列被拆分 我尝试使用quotechar参数,但这只能取一个值。任何帮助都将不胜感激对于您提供的示例数据,额外的分隔符仅显示在标题行中。因此,您可以使用names关键字提供自己的列名,然后告诉Pandas跳

我有这样的原始文件,大约有20k列,类似于:

number|colour|(a|1)|animal
1|green|x|dog
2|blue|y|cat
3|red|z|owl 
当我使用read_csv('raw.csv',sep='|')时,会创建一个带有额外列的数据帧,因为(a | 1)列被拆分


我尝试使用quotechar参数,但这只能取一个值。任何帮助都将不胜感激

对于您提供的示例数据,额外的分隔符仅显示在标题行中。因此,您可以使用
names
关键字提供自己的列名,然后告诉Pandas跳过标题行,如下所示:

import pandas as pd

df = pd.read_csv('raw.csv', sep='|', skiprows=1, names=["number", "colour", "(a|1)", "animal"])
print df
这将给你:

   number colour (a|1) animal
0       1  green     x    dog
1       2   blue     y    cat
2       3    red     z   owl

可能会有所帮助。您问题中的数据的一些非常特殊的内容是
pd.read_csv('raw.csv',sep=“(?)?