Python 无错误,但数据帧的长度不';t匹配实际长度can';我不明白为什么

Python 无错误,但数据帧的长度不';t匹配实际长度can';我不明白为什么,python,pandas,Python,Pandas,显然,您有19398698个条目,但只有429365个唯一索引值,或者索引值不符合顺序。请参见此示例: for folder in os.listdir(folder_path): for file in os.listdir(f'{folder_path}/{folder}'): os.chdir(f"{folder_path}/{folder}') if file == 'AMAT.txt': df = pd.read_csv(f'{file}', heade

显然,您有19398698个条目,但只有429365个唯一索引值,或者索引值不符合顺序。请参见此示例:

for folder in os.listdir(folder_path):
  for file in os.listdir(f'{folder_path}/{folder}'):
    os.chdir(f"{folder_path}/{folder}')
    if file == 'AMAT.txt':
      df = pd.read_csv(f'{file}', header=None, sep='  ')
      df['date'] = os.getcwd().split('/')[5]
      df['name'] = f'{file}'
      all_files = pd.concat([all_files, df])
    print(f'{folder}_{file}')
    os.chdir("/content")
x
0  1
2  2
1  3
df.info()
INT64索引:3个条目,0到1
那就做吧

   x
0  1
2  2
1  3

df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 3 entries, 0 to 1
df1=df.sort\u index()
df1.info()
INT64索引:3个条目,0到2

您是否有重复的索引值?您要求我们与您一起玩20个问题。。。“你的数据在哪里”。。。“它看起来像什么”。。。“它是如何产生的”。。。等等。你能提供一点细节让我们更容易理解这里的上下文吗?Stef的答案是正确的,但我们需要看看你是如何构建这个数据框架的。我猜您与多个数据帧进行了某种连接,如果您看到您的数据帧增加了预期数量的5倍,则会导致重复。@EdekiOkoh我进行了编辑,以显示我是如何创建的。是的,我想这一定是重复的。@G.Anderson是的,先生。我正在想办法解决这个问题。或者,如果你能告诉我如何避免它,从df=df开始。需要重置索引(drop=True),但是的,我没有重复的值,索引只是在每次协商后都不会更新
   x
0  1
2  2
1  3

df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 3 entries, 0 to 1
df1 = df.sort_index()
df1.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 3 entries, 0 to 2