Python 如何将Dataframe中的字符串数据更改为数字?
我有10000个数据集。这些数据来自UCI机器学习知识库普查收入 无论如何,关键是我想把字符串数据改成数据。我想运行朴素贝叶斯分类,但我需要使用数字 基本上:Python 如何将Dataframe中的字符串数据更改为数字?,python,python-3.x,dataframe,machine-learning,Python,Python 3.x,Dataframe,Machine Learning,我有10000个数据集。这些数据来自UCI机器学习知识库普查收入 无论如何,关键是我想把字符串数据改成数据。我想运行朴素贝叶斯分类,但我需要使用数字 基本上: State-gov = 1 Self-emp-not-inc = 2 Private = 3 数据帧: 年龄工人阶级fnlwgt。。。每周工作小时本国收入 0 39州政府77516。。。40美国df['DataFrame Column']=pd.to_numeric(df['DataFrame Column'])大多数数据科学的方法是使
State-gov = 1
Self-emp-not-inc = 2
Private = 3
数据帧:
年龄工人阶级fnlwgt。。。每周工作小时本国收入
0 39州政府77516。。。40美国df['DataFrame Column']=pd.to_numeric(df['DataFrame Column'])大多数数据科学的方法是使用pandas'dtype=“category”
告诉我你是否能找到你想要的
(1) astype(int)方法:
(2) to_数值方法:
例如:
import pandas as pd
Data = {'Product': ['AAA','BBB'],
'Price': ['210','250']}
df = pd.DataFrame(Data)
print (df)
print (df.dtypes)
或者,您是否需要将这些字符串替换为可以查看或使用sklearn
包的字符串。
df['DataFrame Column'] = df['DataFrame Column'].astype(int)
df['DataFrame Column'] = pd.to_numeric(df['DataFrame Column'])
import pandas as pd
Data = {'Product': ['AAA','BBB'],
'Price': ['210','250']}
df = pd.DataFrame(Data)
print (df)
print (df.dtypes)