如何';比例数据';在Pandas或任何其他Python库中

如何';比例数据';在Pandas或任何其他Python库中,python,pandas,Python,Pandas,我正在分析存储“公司名称”、“公司利润”的公司数据集。我还有另一个数据集,其中包含“员工人数”、“反馈(负面或正面)”。我想分析利润价值更高的公司是否有更多积极的员工。所以问题是,我的“公司利润”将达到数百万或数十亿,而员工数量将相当少 那么,我可以在这里缩放数据或做其他事情吗 欢迎您提出建议。如果您有如下表格: 公司名称公司利润#员工反馈(负面或正面) 0α1000000 10正 1布拉沃13000000210正 2.2300000 16负 3德尔塔130000 1负 想要一张像这样的桌子:

我正在分析存储“公司名称”、“公司利润”的公司数据集。我还有另一个数据集,其中包含“员工人数”、“反馈(负面或正面)”。我想分析利润价值更高的公司是否有更多积极的员工。所以问题是,我的“公司利润”将达到数百万或数十亿,而员工数量将相当少

那么,我可以在这里缩放数据或做其他事情吗


欢迎您提出建议。

如果您有如下表格:

公司名称公司利润#员工反馈(负面或正面)
0α1000000 10正
1布拉沃13000000210正
2.2300000 16负
3德尔塔130000 1负
想要一张像这样的桌子:

公司名称公司利润(百万)#员工反馈(负面或正面)
0α1.00 10正
1布拉沃13.00 210正
2.30 16负
3δ0.13 1负
然后可以使用
apply
方法和
lambda
函数重新缩放数据

#此部分创建原始表
作为pd进口熊猫
列=[‘公司名称’、‘公司利润’、‘员工人数’、‘反馈(负面或正面)’]
df=pd.DataFrame([('Alpha',1000000,10,'Positive'),
('Bravo',13000000,210,'Positive'),
('Charlie',2300000,16,'Negative'),
('Delta',130000,1,'Negative')],列=列)
#此部分进行修改
df[‘公司利润(百万)’]=df[‘公司利润’]。适用(λx:x/1000000)
df=df[“公司名称”,“公司利润(百万)”,#员工人数”,“反馈(负面或正面)”]
请提供一个