Python Pandas创建包含第一个标题列的数据帧';这是我们自己的一排
我正在与管理员一起工作,使用Python Pandas创建包含第一个标题列的数据帧';这是我们自己的一排,python,pandas,csv,gdelt,Python,Pandas,Csv,Gdelt,我正在与管理员一起工作,使用pd.DataFrame.from_csv(path_to_data,sep=“,”)创建pandasDataFrame时遇到问题,这似乎可以很好地加载数据,但第一个标题列被移动到第1行的情况除外,如下所示: 箭头指示源应位于何处。以下是CSV格式的原始数据片段: Source,Actor1Type1Code,Actor1Type2Code,Actor1Geo_CountryCode,Target,Actor2Type1Code,Actor2Type2Code,Ac
pd.DataFrame.from_csv(path_to_data,sep=“,”)
创建pandasDataFrame时遇到问题,这似乎可以很好地加载数据,但第一个标题列被移动到第1行的情况除外,如下所示:
箭头指示源应位于何处。以下是CSV格式的原始数据片段:
Source,Actor1Type1Code,Actor1Type2Code,Actor1Geo_CountryCode,Target,Actor2Type1Code,Actor2Type2Code,Actor2Geo_CountryCode,EventCode,f0_
PRINCE,GOV,,CA,CITIZEN,CVL,,CA,051,61
MEDIA,MED,,CA,MINIST,GOV,,CA,090,39
SUPREME COURT,JUD,,CA,DOCTOR,HLH,,CA,060,31
POLICE,COP,,CA,TORONTO,,,CA,173,31
PUBLISHER,MED,,CA,BUSINESS,BUS,,CA,010,29
HOSPITAL,HLH,,CA,POLICE,COP,,CA,043,28
HOSPITAL,HLH,,CA,TORONTO,,,CA,043,26
POLICE,COP,,CA,HOSPITAL,HLH,,CA,042,26
PRIME MINISTER,GOV,,CA,GERMANY,,,FR,042,22
谢谢
卡尔文不要使用来自_csv的,
它不再被维护,请使用:
或通过参数:
因此,它不会将第一列解释为索引列如果我的答案回答了你的问题,你能接受吗?我知道,我的答案左上角会有一个空的勾号,谢谢。虽然我知道这正是问题所在,但我要等到以后才能真正测试它。但我现在会接受的。谢谢你的回复!我确信这是文档的问题:显示index\u col
的默认值是0
,因此它将您的第一个col作为索引,将其设置为None
或使用pd.read\u csv
将很好地工作,这就是问题所在。
In [244]:
t="""Source,Actor1Type1Code,Actor1Type2Code,Actor1Geo_CountryCode,Target,Actor2Type1Code,Actor2Type2Code,Actor2Geo_CountryCode,EventCode,f0_
PRINCE,GOV,,CA,CITIZEN,CVL,,CA,051,61
MEDIA,MED,,CA,MINIST,GOV,,CA,090,39
SUPREME COURT,JUD,,CA,DOCTOR,HLH,,CA,060,31
POLICE,COP,,CA,TORONTO,,,CA,173,31
PUBLISHER,MED,,CA,BUSINESS,BUS,,CA,010,29
HOSPITAL,HLH,,CA,POLICE,COP,,CA,043,28
HOSPITAL,HLH,,CA,TORONTO,,,CA,043,26
POLICE,COP,,CA,HOSPITAL,HLH,,CA,042,26
PRIME MINISTER,GOV,,CA,GERMANY,,,FR,042,22"""
df = pd.read_csv(io.StringIO(t))
df
Out[244]:
Source Actor1Type1Code Actor1Type2Code Actor1Geo_CountryCode \
0 PRINCE GOV NaN CA
1 MEDIA MED NaN CA
2 SUPREME COURT JUD NaN CA
3 POLICE COP NaN CA
4 PUBLISHER MED NaN CA
5 HOSPITAL HLH NaN CA
6 HOSPITAL HLH NaN CA
7 POLICE COP NaN CA
8 PRIME MINISTER GOV NaN CA
Target Actor2Type1Code Actor2Type2Code Actor2Geo_CountryCode EventCode \
0 CITIZEN CVL NaN CA 51
1 MINIST GOV NaN CA 90
2 DOCTOR HLH NaN CA 60
3 TORONTO NaN NaN CA 173
4 BUSINESS BUS NaN CA 10
5 POLICE COP NaN CA 43
6 TORONTO NaN NaN CA 43
7 HOSPITAL HLH NaN CA 42
8 GERMANY NaN NaN FR 42
f0_
0 61
1 39
2 31
3 31
4 29
5 28
6 26
7 26
8 22
df = pd.DataFrame.from_csv(io.StringIO(t), index_col=None)