Python pandas read_csv列数据类型设置为十进制，但转换为字符串_Python_Csv_Pandas_Type Conversion_Decimal

Python pandas read_csv列数据类型设置为十进制，但转换为字符串

python csv pandas

Python pandas read_csv列数据类型设置为十进制，但转换为字符串,python,csv,pandas,type-conversion,decimal,Python,Csv,Pandas,Type Conversion,Decimal,我正在使用pandas（v0.18.1）从名为“test.csv”的文件中导入以下数据： a,b,c,d 1,1,1,1.0 我已将列“c”和“d”的数据类型设置为“decimal.decimal”，但它们返回的是类型“str” import pandas as pd import decimal as D df = pd.read_csv('test.csv', dtype={'a': int, 'b': float, 'c': D.Decimal, 'd': D.Decimal}) f

我正在使用pandas（v0.18.1）从名为“test.csv”的文件中导入以下数据：

a,b,c,d
1,1,1,1.0

我已将列“c”和“d”的数据类型设置为“decimal.decimal”，但它们返回的是类型“str”

import pandas as pd
import decimal as D

df = pd.read_csv('test.csv', dtype={'a': int, 'b': float, 'c': D.Decimal, 'd': D.Decimal})

for i, v in df.iterrows():
    print(type(v.a), type(v.b), type(v.c), type(v.d))

结果:

`<class 'int'> <class 'float'> <class 'str'> <class 'str'>`

`<class 'int'> <class 'float'> <class 'float'> <class 'str'>`

`<class 'decimal.Decimal'>`

结果:

`<class 'int'> <class 'float'> <class 'str'> <class 'str'>`

`<class 'int'> <class 'float'> <class 'float'> <class 'str'>`

`<class 'decimal.Decimal'>`

结果:

`<class 'int'> <class 'float'> <class 'str'> <class 'str'>`

`<class 'int'> <class 'float'> <class 'float'> <class 'str'>`

`<class 'decimal.Decimal'>`

``

我认为您需要转换器：

import pandas as pd
import io
import decimal as D

temp = u"""a,b,c,d
           1,1,1,1.0"""

# after testing replace io.StringIO(temp) to filename
df = pd.read_csv(io.StringIO(temp), 
                 dtype={'a': int, 'b': float}, 
                 converters={'c': D.Decimal, 'd': D.Decimal})

print (df)
       a    b  c    d
    0  1  1.0  1  1.0

for i, v in df.iterrows():
    print(type(v.a), type(v.b), type(v.c), type(v.d))

    <class 'int'> <class 'float'> <class 'decimal.Decimal'> <class 'decimal.Decimal'>

将熊猫作为pd导入
输入io
将十进制输入为D
温度=u“a、b、c、d
1,1,1,1.0"""
#测试后，将io.StringIO（temp）替换为文件名
df=pd.read\U csv（io.StringIO（温度），
数据类型={a'：int，'b'：float}，
转换器={'c'：D.十进制，'D'：D.十进制}）
打印（df）
a、b、c、d
0  1  1.0  1  1.0
对于df.iterrows（）中的i，v：
印刷品（a型、b型、c型、d型）

，但由于我假设

pandas

中的实现基于

numpy

。请记住，与使用基本

int

和

float

相比，使用泛型对象在性能和内存方面可能效率更低。