Dataframe 使用“新建”创建新列;“其他变量”;

Dataframe 使用“新建”创建新列;“其他变量”;,dataframe,Dataframe,在这个数据集中有七种鱼类,有些几乎没有观察到。为了使物种分析更容易一些,我需要在数据中创建一个名为Species.grouped的新列,指示鱼是“鲈鱼”、“鲷鱼”还是“其他”。因此,我必须将5个最小的“物种”组分为一个称为“其他”的组。如果鱼是鲈鱼,则结果列(Species.grouped)的值应为“Perch”,如果鱼是鲷鱼,则为“Bream”,如果鱼是其他任何东西,则为“Other” 然后,我需要使用种类、分组和宽度作为独立预测变量(无交互作用)来运行回归预测鱼的重量。看起来是一个问题,可以

在这个数据集中有七种鱼类,有些几乎没有观察到。为了使物种分析更容易一些,我需要在数据中创建一个名为Species.grouped的新列,指示鱼是“鲈鱼”、“鲷鱼”还是“其他”。因此,我必须将5个最小的“物种”组分为一个称为“其他”的组。如果鱼是鲈鱼,则结果列(Species.grouped)的值应为“Perch”,如果鱼是鲷鱼,则为“Bream”,如果鱼是其他任何东西,则为“Other”


然后,我需要使用种类、分组和宽度作为独立预测变量(无交互作用)来运行回归预测鱼的重量。

看起来是一个问题,可以通过使用字典将“种类”值映射到期望值/类别,如“鲈鱼”、“鲷鱼”和“其他”,然后将其应用到熊猫身上来解决


展示了大量可以帮助您实现需求的示例。

这是否回答了您的问题?