Pandas 读取CSV会创建太多的行/列
我正在熊猫图书馆使用数据帧。我在Excel中有一个数据表,保存为CSV,然后调用Pandas 读取CSV会创建太多的行/列,pandas,dataframe,Pandas,Dataframe,我正在熊猫图书馆使用数据帧。我在Excel中有一个数据表,保存为CSV,然后调用 df=pd.read\u csv(“file.csv”) 我希望这个框架看起来像 Item1 Item2 Item3 0 12.00 3 2 1 4.00 8 4 2 3.14 2 8 但是我得到了 Item1 Item2 Item3 Unnamed: 3 Unnamed: 4 0 12.00 3 2
df=pd.read\u csv(“file.csv”)
我希望这个框架看起来像
Item1 Item2 Item3
0 12.00 3 2
1 4.00 8 4
2 3.14 2 8
但是我得到了
Item1 Item2 Item3 Unnamed: 3 Unnamed: 4
0 12.00 3 2 NaN NaN
1 4.00 8 4 NaN NaN
2 3.14 2 8 NaN NaN
或者有时使用所有NaN
值的额外行。似乎pandas
不知道CSV的实际大小。Excel中的数据组织得非常好,数据值都是非空的,并且完全在一个矩形中。我该如何解决这个问题?是否可以对CSV进行编辑,以指定其正确大小
根据要求,这里有一段数据。它下降到大约2500行,右边没有更多的值
原始Excel文件中可能有一个非空单元格(例如空格
)。如果pandas中有2列未命名,请尝试删除原始Excel文件中的2列
另一种方法是保留所有未命名的列。您可以通过以下方式完成此操作:
real_cols = [x for x in df.columns if not x.startswith("Unnamed: ")]
df = df[real_cols]
然后您可以保存csv。您可以发布实际数据文件的简短示例吗?@Simon现在开始!是否可以发布在记事本等编辑器中查看的实际csv原始文本片段,而不是Excel中的表格视图?我不认为pandas有什么问题,我认为它与您的数据集有关。csv解析的一个常见问题是分隔符,请确保您的数据列不包含分隔符。你似乎不是这样。我唯一能想到的是您的行结束符可能与您的计算机预期的结束符/换行符不匹配95%确定csv是脏的