Pandas 读取CSV会创建太多的行/列

Pandas 读取CSV会创建太多的行/列,pandas,dataframe,Pandas,Dataframe,我正在熊猫图书馆使用数据帧。我在Excel中有一个数据表,保存为CSV,然后调用 df=pd.read\u csv(“file.csv”) 我希望这个框架看起来像 Item1 Item2 Item3 0 12.00 3 2 1 4.00 8 4 2 3.14 2 8 但是我得到了 Item1 Item2 Item3 Unnamed: 3 Unnamed: 4 0 12.00 3 2

我正在熊猫图书馆使用数据帧。我在Excel中有一个数据表,保存为CSV,然后调用

df=pd.read\u csv(“file.csv”)

我希望这个框架看起来像

   Item1  Item2  Item3
0  12.00      3      2
1   4.00      8      4
2   3.14      2      8
但是我得到了

   Item1  Item2  Item3 Unnamed: 3 Unnamed: 4
0  12.00      3      2        NaN        NaN
1   4.00      8      4        NaN        NaN
2   3.14      2      8        NaN        NaN
或者有时使用所有
NaN
值的额外行。似乎
pandas
不知道CSV的实际大小。Excel中的数据组织得非常好,数据值都是非空的,并且完全在一个矩形中。我该如何解决这个问题?是否可以对CSV进行编辑,以指定其正确大小

根据要求,这里有一段数据。它下降到大约2500行,右边没有更多的值


原始Excel文件中可能有一个非空单元格(例如空格
)。如果pandas中有2列未命名,请尝试删除原始Excel文件中的2列

另一种方法是保留所有未命名的列。您可以通过以下方式完成此操作:

real_cols = [x for x in df.columns if not x.startswith("Unnamed: ")]
df = df[real_cols]

然后您可以保存csv。

您可以发布实际数据文件的简短示例吗?@Simon现在开始!是否可以发布在记事本等编辑器中查看的实际csv原始文本片段,而不是Excel中的表格视图?我不认为pandas有什么问题,我认为它与您的数据集有关。csv解析的一个常见问题是分隔符,请确保您的数据列不包含分隔符。你似乎不是这样。我唯一能想到的是您的行结束符可能与您的计算机预期的结束符/换行符不匹配95%确定csv是脏的