Python 如何使具有值的行重复n次并删除不具有值的行
我有一个数据框,其中RoomID显示在每个RoomID的多行中 例如,如果RoomID的值为i={1…1000},那么我们就有多个1或2或…100,当然用行表示 我想删除RoomID出现次数少于20次的行。换句话说,如果一个房间(由RoomID表示)至少20次不在数据帧中,我希望它被删除 我为澄清而编写的一些伪代码:Python 如何使具有值的行重复n次并删除不具有值的行,python,Python,我有一个数据框,其中RoomID显示在每个RoomID的多行中 例如,如果RoomID的值为i={1…1000},那么我们就有多个1或2或…100,当然用行表示 我想删除RoomID出现次数少于20次的行。换句话说,如果一个房间(由RoomID表示)至少20次不在数据帧中,我希望它被删除 我为澄清而编写的一些伪代码: for i in range(1000): if len(df[df['RoomID']==i]>20): #keep
for i in range(1000):
if len(df[df['RoomID']==i]>20):
#keep rows with RoomID==i
else:
#remove rows with RoomID=i
我是python新手,所以请记住这一点,然后再回答
我不会理解复杂的python内容。我以前在R中研究过这些问题
示例:
输入数据帧:
室友|颜色
1 |蓝色
1 |黑色
1 |紫色
2 |红色
n=2的输出数据帧(因此我们希望所有房间ID出现2次以上):
室友|颜色
1 |蓝色
1 |黑色
1 |紫色添加样本输入和样本输出。提供一个。有帮助吗?这听起来很相似(也许你必须减少答案),这是谷歌第一次成功推出“过滤掉熊猫中罕见条目的行”@Nic3500我在一个非常简单的数据框架上添加了这些变化的样子添加样本输入和样本输出。提供一个。有帮助吗?这听起来很相似(也许你必须减少答案),这是谷歌首次成功推出的“过滤掉熊猫中罕见条目的行”@Nic3500我在一个非常简单的数据框中添加了这些变化