Python 熊猫随机换行
我有一个熊猫数据框,其中一列有航空公司名称(或公司名称)。 我想通过将一小部分名称(仅在一列中)更改为相似但不相同的名称来生成一个“混乱”数据集。 所以联合航空公司将成为联合航空公司。 下面是我的数据集示例Python 熊猫随机换行,python,pandas,Python,Pandas,我有一个熊猫数据框,其中一列有航空公司名称(或公司名称)。 我想通过将一小部分名称(仅在一列中)更改为相似但不相同的名称来生成一个“混乱”数据集。 所以联合航空公司将成为联合航空公司。 下面是我的数据集示例 Description 0 United Airlines 1 Pinnacle Airlines Inc. 2 Ryanair 3 British Airways 是否存在按行随机将stings更改应用于Pandas数据帧的方法。 有人有什么想法吗 您可以使用numpy.
Description
0 United Airlines
1 Pinnacle Airlines Inc.
2 Ryanair
3 British Airways
是否存在按行随机将stings更改应用于Pandas数据帧的方法。
有人有什么想法吗 您可以使用
numpy.random.choice
返回索引的随机选择,它采用1-D数组并返回传递大小的随机选择:
In [177]:
rand_indices = np.random.choice(df.index, 2)
rand_indices.sort()
rand_indices
Out[177]:
array([1, 2], dtype=int64)
In [178]:
df.loc[rand_indices]
Out[178]:
Description a
1 Pinnacle Airlines Inc. 1
2 Ryanair 2
In [179]:
def scramble_text(df, index, col):
df.loc[index, col] = df[col].str.upper()
scramble_text(df, rand_indices, 'Description')
df
Out[179]:
Description a
0 United Airlines 0
1 PINNACLE AIRLINES INC. 1
2 RYANAIR 2
3 British Airways 3
谢谢,这正是我想要的。我需要更好地学习df.loc函数:)