Python pandas read_csv无法正确读取行,因为csv文件中有双引号

Python pandas read_csv无法正确读取行,因为csv文件中有双引号,python,pandas,csv,Python,Pandas,Csv,我正在尝试使用pandas read_csv读取excel中创建的csv文件。csv文件的格式为: some text,some number,some text,some text,amount SWE-WWW,123344422,Hello,SWE,"1,222.50 SEK" SWE-W12,3124123412,Hello,SWE,450.50 SEK 我的问题是,amount列中的值中的引号导致整行作为字符串读取,并放在dataframe的第一列中 因此,当我读取csv文件并打印它时

我正在尝试使用pandas read_csv读取excel中创建的csv文件。csv文件的格式为:

some text,some number,some text,some text,amount
SWE-WWW,123344422,Hello,SWE,"1,222.50 SEK"
SWE-W12,3124123412,Hello,SWE,450.50 SEK
我的问题是,amount列中的值中的引号导致整行作为字符串读取,并放在dataframe的第一列中

因此,当我读取csv文件并打印它时:

test = pd.read_csv('test.csv', quotechar='"', sep=',')
print(test)
我得到输出:

   some text    some number    some text.1    some text.2    amount
0  SWE-WWW,123344422,Hello,SWE,"1,222.50 SEK"  NaN  NaN  NaN  NaN
1  SWE-W12     3.124123e+09          Hello           SWE     450.50 SEK
如您所见,pandas不会将第1行转换为字符串,因为amount列中的值中没有引号


如何读取csv文件并获取列中的结构化数据?

当读取csv文件时,每列都会获取数据类型,您可以运行df.descripte 字符串的级别高于整数。 熊猫的最高级别是对象

您可以运行:

df['amount'] = df['amount'].apply(lambda x: float(x))

如果您确定所有列均为数字

我无法在0.25上复制此问题。尝试升级:pip安装-升级Pandas我也不能用版本0.20.3复制它。