Pandas osx中保存和加载的数据帧行大小不同_Pandas_Dataframe

Pandas osx中保存和加载的数据帧行大小不同

pandas dataframe

Pandas osx中保存和加载的数据帧行大小不同,pandas,dataframe,Pandas,Dataframe,我发生了一件很奇怪的事。我保存了一个包含100000行的dataframe文件，但加载的行大小不同。逻辑在windows中进行了测试，工作正常，但在osx中没有我想知道是否有人和我有同样的问题，或者我遗漏了什么代码如下： dataframe.to_csv('./aa.csv', index=False) print(dataframe.shape) df = pd.read_csv('./aa.csv') print(df.shape) 结果呢 (100000, 128) (167469,

我发生了一件很奇怪的事。我保存了一个包含100000行的dataframe文件，但加载的行大小不同。逻辑在windows中进行了测试，工作正常，但在osx中没有

我想知道是否有人和我有同样的问题，或者我遗漏了什么

代码如下：

dataframe.to_csv('./aa.csv', index=False)
print(dataframe.shape)
df = pd.read_csv('./aa.csv')
print(df.shape)

结果呢

(100000, 128)
(167469, 128)

我用随机数据帧进行了测试

df = pd.DataFrame(pd.np.random.randint(0,100,size=(100000, 128)))

那么测试结果就和我预期的一样了

(100000, 128)
(100000, 128)

所以我认为我的数据可能有问题，但我不知道从哪里开始。我想知道，如果这种问题发生在数据帧在一定条件下

增加：我又发现了一个奇怪的

print(dataframe.ORD_NO[0])
0    22424855
0    22019413
0    21988486
0    22026683
0    22385278
0    21999297
0    22006981
0    22041489
0    22529317
0    22340157
Name: ORD_NO, dtype: object

print(df.ORD_NO[0])
22424855.0

数据帧索引似乎无法正常工作。我希望此检测有助于解释。

您的代码中是否发生了合并或合并？我认为有一些重复发生。您可以做的是加载两个CSV并进行差异，以查看两个数据帧之间复制了什么。是的。追加（df2）正在发生。即使我注释掉了dataframe的追加逻辑，它仍然会产生同样的问题df2从哪里来？您是否100%确定使用的是相同的数据？是的，第一个df来自数据库中的选定数据，第二个df也来自数据库中的选定数据，但df和df2的选择日期不同。我100%确信他们是不同的。但不知何故，索引或某些合并逻辑完全被破坏了，我想。在您的代码中是否发生了合并或合并？我认为有一些重复发生。您可以做的是加载两个CSV并进行差异，以查看两个数据帧之间复制了什么。是的。追加（df2）正在发生。即使我注释掉了dataframe的追加逻辑，它仍然会产生同样的问题df2从哪里来？您是否100%确定使用的是相同的数据？是的，第一个df来自数据库中的选定数据，第二个df也来自数据库中的选定数据，但df和df2的选择日期不同。我100%确信他们是不同的。但不知何故，我认为索引或某些合并逻辑完全被破坏了。