Python pandas.errors.ParserError:指定的列太多:应为9996列,找到9808列

Python pandas.errors.ParserError:指定的列太多:应为9996列,找到9808列,python,pandas,Python,Pandas,当我使用熊猫来处理我的数据时,这里有一个类似标题的错误。我的数据列不相等,所以我按降序排序。第一行最长,下一行较短,依此类推。当文件很小时,熊猫可以成功地处理它。但在我将所有数据写入文件后,它无法处理并显示此错误 这是我的密码: def sequencein(filepath): print (filepath) print("time", time.time()) data = pd.read_table(filepath, header=Non

当我使用熊猫来处理我的数据时,这里有一个类似标题的错误。我的数据列不相等,所以我按降序排序。第一行最长,下一行较短,依此类推。当文件很小时,熊猫可以成功地处理它。但在我将所有数据写入文件后,它无法处理并显示此错误

这是我的密码:

def sequencein(filepath):    
    print (filepath)    
    print("time", time.time())    
    data = pd.read_table(filepath, header=None)    
    print("time", time.time())    
    matr = data.values    
    print("sequence shape:", matr.shape)    
    return matr
文件的行尾如下所示:
我自己解决了这个问题。我刚刚将
data=pd.read\u表(filepath,header=None)
修改为
data=pd.read\u表(filepath)
。然后我在我的数据文件中添加了一个标题行,它成功了。

说有两个引擎:

引擎:{c',python'},可选

要使用的解析器引擎。C引擎的速度更快,而python引擎目前的功能更加完整

问题似乎只出现在“c”引擎上,它是为较大的文件自动选择的

所以,你可以试试

data = pd.read_table(filepath, header=None, engine='python')  

你确定这是错误的根源吗?是的,现在我已经解决了这个问题,我添加了一个包含9996列的标题,然后它就工作了。无论如何,谢谢你。