Python 如何在Jupyter笔记本中使用pandas修改CSV格式的数据？_Python_Pandas_Jupyter Notebook

Python 如何在Jupyter笔记本中使用pandas修改CSV格式的数据？

python pandas jupyter-notebook

Python 如何在Jupyter笔记本中使用pandas修改CSV格式的数据？,python,pandas,jupyter-notebook,Python,Pandas,Jupyter Notebook,我正在使用pandas将CSV文件读入Jupyter笔记本中名为“data”的变量，如下所示将熊猫作为pd导入将numpy作为np导入导入seaborn作为sns 将matplotlib.pyplot作为plt导入 data=pd.read\u csv（“C:/Users/hp/Desktop/dv project/googleplaystorecleaned.csv”）我尝试使用以下代码修改的“Size”列以删除字符“M”和“k” for i in range(len(data['

我正在使用pandas将CSV文件读入Jupyter笔记本中名为“data”的变量，如下所示

将熊猫作为pd导入
将numpy作为np导入
导入seaborn作为sns
将matplotlib.pyplot作为plt导入
data=pd.read\u csv（“C:/Users/hp/Desktop/dv project/googleplaystorecleaned.csv”）

我尝试使用以下代码修改的“Size”列以删除字符“M”和“k”

for i in range(len(data['Size'])):
    data['Size'][i]=str(data['Size'][i])
    data['Size'][i]=data['Size'][i].replace('M','')
    data['Size'][i]=data['Size'][i].replace('k','')
    data['Size'][i]=data['Size'][i].replace('Varies with device','')
    data['Size'][i]=float(data['Size'][i])
print(data['Size'])

代码似乎只在数据集上部分工作，因为我将获得以下输出

0                        19
1                        14
2                       8.7
3                        25
4                       2.8
                ...        
10836                   53M
10837                  3.6M
10838                  9.5M
10839    Varies with device
10840                   19M
Name: Size, Length: 10829, dtype: object

请给出正确的方法。

我创建了一个示例数据框来显示结果：

df = pd.DataFrame({'A': [1,2,1], 'B': [3,4,3], 'Size': ['Ma2','kb3','3l Varies with device po']})
for i, v in enumerate(df['Size'].values):
    v = v.replace('M', '')
    v = v.replace('k', '')
    v = v.replace('Varies with device', '')
    df['Size'].values[i] = v
print(df)

之前：

    A   B   Size
0   1   3   Mfoobar1
1   2   4   kfoobar2
2   1   3   Varies with devicefoobar3

之后：

    A   B   Size
0   1   3   foobar1
1   2   4   foobar2
2   1   3   foobar3

嗨，你也可以试试这个：

import pandas as pd
list1= ['20M','9M','10K','10']
dataframe1=pd.DataFrame(data=list1,columns=['Size'])

for i, s in enumerate(dataframe1['Size']):
    if s[len(s)-1]=='M':
        dataframe1['Col1'][i]=dataframe1['Size'][i].replace('M',"")
    if s[len(s)-1]=='K':
        dataframe1['Col1'][i]=dataframe1['Size'][i].replace('K',"")


dataframe1

您将获得预期的输出

注意：您可以根据自己的要求添加if条件

您只是想提取数字吗？如果是这样，就使用一些正则表达式