Pandas 使用不同的分隔符(逗号)读取大熊猫中的csv

Pandas 使用不同的分隔符(逗号)读取大熊猫中的csv,pandas,csv,Pandas,Csv,我想读取一个CSV文件并将其保存为pandas中的数据帧 但我有一个问题,因为我有这样的行: BG,6141.6,6141.6,,3.0,,,ic 如您所见,有三个分隔符:、、、、、、、、和、 如何将其正确加载到pandas中?使用正则表达式分隔符[,]+-一个或多个,: import pandas as pd from pandas.compat import StringIO temp=u"""iBG,6141.6,6141.6,,3.0,,,ic""" #after testing r

我想读取一个CSV文件并将其保存为pandas中的数据帧

但我有一个问题,因为我有这样的行:

BG,6141.6,6141.6,,3.0,,,ic
如您所见,有三个分隔符:
、、、、
、、、


如何将其正确加载到pandas中?

使用正则表达式分隔符
[,]+
-一个或多个

import pandas as pd
from pandas.compat import StringIO

temp=u"""iBG,6141.6,6141.6,,3.0,,,ic"""
#after testing replace 'StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp), sep="[,]+", header=None, engine='python')
print (df)
     0       1       2    3   4
0  iBG  6141.6  6141.6  3.0  ic

使用正则表达式分隔符
[,]+
-一个或多个

import pandas as pd
from pandas.compat import StringIO

temp=u"""iBG,6141.6,6141.6,,3.0,,,ic"""
#after testing replace 'StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp), sep="[,]+", header=None, engine='python')
print (df)
     0       1       2    3   4
0  iBG  6141.6  6141.6  3.0  ic

您应该仔细查看数据,最有可能的是,多个分隔符将意味着您的数据有8列,但在该特定行中的列4、6和7是BLANKIS,因为列是空的或其他原因。您应该指示您已经尝试过的内容,以及为什么您认为它不起作用。有列名吗?@jezrael是的,有。问题是,熊猫只能读45000行,而不是100万行。我没有使用一些特殊选项,只提供了路径。我在帖子中给出的数据结构。解决方案是什么?您应该仔细查看数据,多个分隔符很可能意味着您的数据有8列,但这一行中的第4、6和7列为空是因为这些列为空还是其他原因?您应该指出您已经尝试了什么,为什么你认为它不起作用。<代码> CSV < /代码>的标题是什么?有列名吗?@jezrael是的,有。问题是,熊猫只能读45000行,而不是100万行。我没有使用一些特殊选项,只提供了路径。我在帖子中给出的数据结构。解决办法是什么?