Python pandas read_csv列数据类型设置为十进制,但转换为字符串
我正在使用pandas(v0.18.1)从名为“test.csv”的文件中导入以下数据:Python pandas read_csv列数据类型设置为十进制,但转换为字符串,python,csv,pandas,type-conversion,decimal,Python,Csv,Pandas,Type Conversion,Decimal,我正在使用pandas(v0.18.1)从名为“test.csv”的文件中导入以下数据: a,b,c,d 1,1,1,1.0 我已将列“c”和“d”的数据类型设置为“decimal.decimal”,但它们返回的是类型“str” import pandas as pd import decimal as D df = pd.read_csv('test.csv', dtype={'a': int, 'b': float, 'c': D.Decimal, 'd': D.Decimal}) f
a,b,c,d
1,1,1,1.0
我已将列“c”和“d”的数据类型设置为“decimal.decimal”,但它们返回的是类型“str”
import pandas as pd
import decimal as D
df = pd.read_csv('test.csv', dtype={'a': int, 'b': float, 'c': D.Decimal, 'd': D.Decimal})
for i, v in df.iterrows():
print(type(v.a), type(v.b), type(v.c), type(v.d))
结果:
`<class 'int'> <class 'float'> <class 'str'> <class 'str'>`
`<class 'int'> <class 'float'> <class 'float'> <class 'str'>`
`<class 'decimal.Decimal'>`
结果:
`<class 'int'> <class 'float'> <class 'str'> <class 'str'>`
`<class 'int'> <class 'float'> <class 'float'> <class 'str'>`
`<class 'decimal.Decimal'>`
结果:
`<class 'int'> <class 'float'> <class 'str'> <class 'str'>`
`<class 'int'> <class 'float'> <class 'float'> <class 'str'>`
`<class 'decimal.Decimal'>`
``
我认为您需要转换器:
import pandas as pd
import io
import decimal as D
temp = u"""a,b,c,d
1,1,1,1.0"""
# after testing replace io.StringIO(temp) to filename
df = pd.read_csv(io.StringIO(temp),
dtype={'a': int, 'b': float},
converters={'c': D.Decimal, 'd': D.Decimal})
print (df)
a b c d
0 1 1.0 1 1.0
for i, v in df.iterrows():
print(type(v.a), type(v.b), type(v.c), type(v.d))
<class 'int'> <class 'float'> <class 'decimal.Decimal'> <class 'decimal.Decimal'>
将熊猫作为pd导入
输入io
将十进制输入为D
温度=u“a、b、c、d
1,1,1,1.0"""
#测试后,将io.StringIO(temp)替换为文件名
df=pd.read\U csv(io.StringIO(温度),
数据类型={a':int,'b':float},
转换器={'c':D.十进制,'D':D.十进制})
打印(df)
a、b、c、d
0 1 1.0 1 1.0
对于df.iterrows()中的i,v:
印刷品(a型、b型、c型、d型)
,但由于我假设pandas
中的实现基于numpy
。请记住,与使用基本int
和float
相比,使用泛型对象在性能和内存方面可能效率更低。