Python 由于某些原因,数据集的大小会发生变化

Python 由于某些原因,数据集的大小会发生变化,python,pandas,dataset,Python,Pandas,Dataset,我正在为学校比赛制作aut ml程序 我遇到了一个问题,在加载数据集时,由于某种原因,它们的大小会发生变化。因此,我不能在机器学习算法中使用它们 1.csv的实际大小为(515,12), 2.csv的实际大小是(31,12) 我尝试了很多,包括: pd.concat([X[i] for i in X.columns]).dropna() pd.concat([X_predict[i] for i in X_predict.columns]).dropna() X.dropna(inplace=

我正在为学校比赛制作aut ml程序

我遇到了一个问题,在加载数据集时,由于某种原因,它们的大小会发生变化。因此,我不能在机器学习算法中使用它们

1.csv的实际大小为(515,12), 2.csv的实际大小是(31,12)

我尝试了很多,包括:

pd.concat([X[i] for i in X.columns]).dropna()
pd.concat([X_predict[i] for i in X_predict.columns]).dropna()

X.dropna(inplace=True)
indices_to_keep = X.isin([np.nan, np.inf, -np.inf])
X_predict.dropna(inplace=True)
indices_to_keep = X_predict.isin([np.nan, np.inf, -np.inf])
我还尝试将数据集写入Excel文件(使用
pd.read\u Excel


您能给我们看几行cvs文件吗?顺便说一下,
X=pd.read\u csv('1.csv')
已经从csv文件创建了一个数据帧。添加了2个屏幕截图。忽略第一个文件中的第13列您可以在文本编辑器(而不是excel)中打开这些文件吗?我怀疑在excel中保存文件时,每行都添加了许多逗号。不,不太可能是excel造成的。我还尝试使用libreofficecalc。我用经典的泰坦尼克号乘客数据集替换了1.csv和2.csv。数据集的大小已变得正常。也许问题就出在这个数据集中,尽管我多次重新创建了它,即使是在不同版本的Excel中
pd.concat([X[i] for i in X.columns]).dropna()
pd.concat([X_predict[i] for i in X_predict.columns]).dropna()

X.dropna(inplace=True)
indices_to_keep = X.isin([np.nan, np.inf, -np.inf])
X_predict.dropna(inplace=True)
indices_to_keep = X_predict.isin([np.nan, np.inf, -np.inf])