Python “保持恒定”;(由11栏改为12栏)“;numpy genfromtxt的错误。我试过其他帖子的解决方案,但都不管用
[数据截图]Python “保持恒定”;(由11栏改为12栏)“;numpy genfromtxt的错误。我试过其他帖子的解决方案,但都不管用,python,numpy,Python,Numpy,[数据截图] output_csv = np.genfromtxt(path, delimiter=',', filling_values=0, autostrip=True, skip_header=1, dtype=({'names': ['sku_num', 'fiscl_wk', 'mkt_nbr', 'mkt_name', 'total_units', 'total_sales',
output_csv = np.genfromtxt(path, delimiter=',', filling_values=0, autostrip=True, skip_header=1,
dtype=({'names': ['sku_num', 'fiscl_wk', 'mkt_nbr', 'mkt_name', 'total_units', 'total_sales',
'econ_cost', 'gm_dollars', 'gm_percent', 'retail', 'aur'],
'formats': [int, int, int, str, int, int, int, int, int, int, int]}))
每次我的输出都是这个,我定义了名称并说跳过标题。标题只是我要重命名的标题
ot 12 columns instead of 11)
Line #114182 (got 12 columns instead of 11)
Line #114186 (got 12 columns instead of 11)
Line #114191 (got 12 columns instead of 11)
Line #114201 (got 12 columns instead of 11)
Line #114217 (got 12 columns instead of 11)
我错过了什么?我曾经尝试过先使用pandas,但它会减慢程序的运行速度(而且效果不是很好),我也知道这应该会起作用。Numpy在遇到比预期更长的数据行时会出现错误。您指定了11个列名和11个列类型,但报告为有12列而不是11列的行中有11个逗号。因此,当numpy搜索
,
分隔符时,它会找到12个条目,而不是11个条目。您需要在一些文本编辑器中打开csv并查看这些行。此文件有多大?在熊猫身上读取csv到df通常相当快?它没有那么大,只是15mb@tosin你能发布一个文件样本,让我们重现你的问题吗?@tosin如果问题不大,你需要超级复制器性能吗?如果没有,我可能会重新考虑熊猫,只是为了方便。@GrigoriyMikhalkin我刚刚上传了一个数据截图,没有看到我可以在哪里附加一个文件,我会为我拉的每一个csv都这样做吗?因为这可能会变得很麻烦。只有在您希望在数据上使用numpy.genfromtxt函数时,才需要先对其进行预处理。您可以尝试中介绍的invalid\u raise=False
选项。我也不认为这是一个选择,我会丢失重要的数据,但是谢谢你