Pandas osx中保存和加载的数据帧行大小不同

Pandas osx中保存和加载的数据帧行大小不同,pandas,dataframe,Pandas,Dataframe,我发生了一件很奇怪的事。我保存了一个包含100000行的dataframe文件,但加载的行大小不同。逻辑在windows中进行了测试,工作正常,但在osx中没有 我想知道是否有人和我有同样的问题,或者我遗漏了什么 代码如下: dataframe.to_csv('./aa.csv', index=False) print(dataframe.shape) df = pd.read_csv('./aa.csv') print(df.shape) 结果呢 (100000, 128) (167469,

我发生了一件很奇怪的事。我保存了一个包含100000行的dataframe文件,但加载的行大小不同。逻辑在windows中进行了测试,工作正常,但在osx中没有

我想知道是否有人和我有同样的问题,或者我遗漏了什么

代码如下:

dataframe.to_csv('./aa.csv', index=False)
print(dataframe.shape)
df = pd.read_csv('./aa.csv')
print(df.shape)
结果呢

(100000, 128)
(167469, 128)
我用随机数据帧进行了测试

df = pd.DataFrame(pd.np.random.randint(0,100,size=(100000, 128)))
那么测试结果就和我预期的一样了

(100000, 128)
(100000, 128)
所以我认为我的数据可能有问题,但我不知道从哪里开始。我想知道,如果这种问题发生在数据帧在一定条件下

增加: 我又发现了一个奇怪的

print(dataframe.ORD_NO[0])
0    22424855
0    22019413
0    21988486
0    22026683
0    22385278
0    21999297
0    22006981
0    22041489
0    22529317
0    22340157
Name: ORD_NO, dtype: object

print(df.ORD_NO[0])
22424855.0

数据帧索引似乎无法正常工作。我希望此检测有助于解释。

您的代码中是否发生了合并或合并?我认为有一些重复发生。您可以做的是加载两个CSV并进行差异,以查看两个数据帧之间复制了什么。是的。追加(df2)正在发生。即使我注释掉了dataframe的追加逻辑,它仍然会产生同样的问题df2从哪里来?您是否100%确定使用的是相同的数据?是的,第一个df来自数据库中的选定数据,第二个df也来自数据库中的选定数据,但df和df2的选择日期不同。我100%确信他们是不同的。但不知何故,索引或某些合并逻辑完全被破坏了,我想。在您的代码中是否发生了合并或合并?我认为有一些重复发生。您可以做的是加载两个CSV并进行差异,以查看两个数据帧之间复制了什么。是的。追加(df2)正在发生。即使我注释掉了dataframe的追加逻辑,它仍然会产生同样的问题df2从哪里来?您是否100%确定使用的是相同的数据?是的,第一个df来自数据库中的选定数据,第二个df也来自数据库中的选定数据,但df和df2的选择日期不同。我100%确信他们是不同的。但不知何故,我认为索引或某些合并逻辑完全被破坏了。