Python 如何删除数据帧中的错误值?
我有一个dataframe,它有多个列,我想从中取出一列,并用该列创建一个新的dataframe。 我的数据帧是Python 如何删除数据帧中的错误值?,python,pandas,dataframe,Python,Pandas,Dataframe,我有一个dataframe,它有多个列,我想从中取出一列,并用该列创建一个新的dataframe。 我的数据帧是 category_id category_name channel_id 24 Entertainment UCv1ZjbkebUwVOJCgtstOBZQ 我正在创建一个新的数据框,因为我希望其中的category_id能够创建10k行 df1 = pd.DataFrame({'category_id': [df['category_id'] for x in rang
category_id category_name channel_id
24 Entertainment UCv1ZjbkebUwVOJCgtstOBZQ
我正在创建一个新的数据框,因为我希望其中的category_id能够创建10k行
df1 = pd.DataFrame({'category_id': [df['category_id'] for x in range(10000)]})
df1.head()
这将创建一个包含10k行的数据帧,但是我在数据帧中得到的值
是
这是错误的,因为我想要这样的值
category_id
0 10
1 10
2 10
3 10
4 10
我通过从df5=pd.dataframe({'category\u id':df4['category\u id']for x in range(10000)})中删除列表理解来更改此数据帧
它解决了这个错误,但没有创建10k记录。
我们可以做些什么来解决这个问题 我认为您需要:
category_id
0 10
1 10
2 10
3 10
4 10
print (df)
category_id category_name channel_id
0 10 Entertainment UCv1ZjbkebUwVOJCgtstOBZQ
1 24 Entertainment UCv1ZjbkebUwVOJCgtstOBZQ
N = 5
df5 = df['category_id'].repeat(N).reset_index(drop=True).to_frame()
print (df5)
category_id
0 10
1 10
2 10
3 10
4 10
5 24
6 24
7 24
8 24
9 24