Python pandas.errors.ParserError:指定的列太多：应为9996列，找到9808列_Python_Pandas

Python pandas.errors.ParserError:指定的列太多：应为9996列，找到9808列

python pandas

Python pandas.errors.ParserError:指定的列太多：应为9996列，找到9808列,python,pandas,Python,Pandas,当我使用熊猫来处理我的数据时，这里有一个类似标题的错误。我的数据列不相等，所以我按降序排序。第一行最长，下一行较短，依此类推。当文件很小时，熊猫可以成功地处理它。但在我将所有数据写入文件后，它无法处理并显示此错误这是我的密码： def sequencein(filepath): print (filepath) print("time", time.time()) data = pd.read_table(filepath, header=Non

当我使用熊猫来处理我的数据时，这里有一个类似标题的错误。我的数据列不相等，所以我按降序排序。第一行最长，下一行较短，依此类推。当文件很小时，熊猫可以成功地处理它。但在我将所有数据写入文件后，它无法处理并显示此错误

这是我的密码：

def sequencein(filepath):    
    print (filepath)    
    print("time", time.time())    
    data = pd.read_table(filepath, header=None)    
    print("time", time.time())    
    matr = data.values    
    print("sequence shape:", matr.shape)    
    return matr

文件的行尾如下所示：

我自己解决了这个问题。我刚刚将

data=pd.read\u表（filepath，header=None）

修改为

data=pd.read\u表（filepath）

。然后我在我的数据文件中添加了一个标题行，它成功了。

说有两个引擎：

引擎：{c'，python'}，可选

要使用的解析器引擎。C引擎的速度更快，而python引擎目前的功能更加完整

问题似乎只出现在“c”引擎上，它是为较大的文件自动选择的

所以，你可以试试

data = pd.read_table(filepath, header=None, engine='python')

你确定这是错误的根源吗？是的，现在我已经解决了这个问题，我添加了一个包含9996列的标题，然后它就工作了。无论如何，谢谢你。