在python中将两列相乘时出现内存错误
我有一个如下所示的数据集:在python中将两列相乘时出现内存错误,python,pandas,numpy,jupyter,Python,Pandas,Numpy,Jupyter,我有一个如下所示的数据集: |---------------------|------------------|------------------| | Rating | Installs | Price | |---------------------|------------------|------------------| | 2.1 | 10,000+ | $8
|---------------------|------------------|------------------|
| Rating | Installs | Price |
|---------------------|------------------|------------------|
| 2.1 | 10,000+ | $8.75 |
|---------------------|------------------|------------------|
| 4.2 | 2,000+ | $5.99 |
|---------------------|------------------|------------------|
| 3.0 | 50,0000+ | $3.22 |
|---------------------|------------------|------------------|
我想计算所有具有
评级为3.1或以下。
我正在使用以下代码(python jupyter)处理Price字符串并安装以获取整数值:
但是我用这个命令得到内存错误。如何使此代码更高效,从而在不给出任何内存错误的情况下计算总利润。变量和函数名称应遵循带下划线的
小写形式。您应该将代码拆分一点,首先将值转换为浮点数data.loc[data['Rating']>=3.1][“Installs”]
这违背了使用loc
的意义。请分享一个。@ACM这解决了我的问题。谢谢,你做了什么?你应该考虑用重构代码发布答案。
Installs = data.loc[ data['Rating']>=3.1 ]["Installs"]
Price = data.loc[ data['Rating']>=3.1 ]["Price"]
Profit = Installs.apply( lambda row: int( sub(r'[^\d.]', '',row )) ) * Price.apply( lambda row: row.strip('$') )