如何在python中组合csv数据

如何在python中组合csv数据,python,pandas,csv,merge,Python,Pandas,Csv,Merge,我有两个CSV文件,我想将它们合并到一个文件中。我的第一个CSV文件名为vector_train.CSV,第二个是label_train.CSV vector_train.csv v1,v2,v3,v100 12,32,15,30 55,72,45,90 label_train.csv sentence,label bad voice,0 good voice,1 我想要这样的输出 vector_train.csv v1,v2,v3,v100,label 12,32,15,30,0 55,7

我有两个CSV文件,我想将它们合并到一个文件中。我的第一个CSV文件名为vector_train.CSV,第二个是label_train.CSV

vector_train.csv
v1,v2,v3,v100
12,32,15,30
55,72,45,90

label_train.csv
sentence,label
bad voice,0
good voice,1
我想要这样的输出

vector_train.csv
v1,v2,v3,v100,label
12,32,15,30,0
55,72,45,90,1

请帮助我

您可以使用pandas dataframe读取csv文件
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

然后将这两个文件合并为一个数据帧
https://stackoverflow.com/questions/12850345/how-to-combine-two-data-frames-in-python-pandas

然后保存在csv文件中
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_csv.html

您可以使用pandas dataframe读取csv文件
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

然后将这两个文件合并为一个数据帧
https://stackoverflow.com/questions/12850345/how-to-combine-two-data-frames-in-python-pandas

然后保存在csv文件中
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_csv.html

您已经说过如何连接两个数据帧。我假设你想一行一行地加入他们:

vector = pd.read_csv('vector_train.csv')
label = pd.read_csv('label_train.csv')

vector['label'] = label['label']
vector.head()
输出:

v1  v2  v3  v100  label
12  32  15  30    0
55  72  45  90    1

您已经说过如何连接这两个数据帧。我假设你想一行一行地加入他们:

vector = pd.read_csv('vector_train.csv')
label = pd.read_csv('label_train.csv')

vector['label'] = label['label']
vector.head()
输出:

v1  v2  v3  v100  label
12  32  15  30    0
55  72  45  90    1

您可以将两个csv导入2个不同的数据帧,然后向第一个数据帧添加一个额外的列,并将其分配给第二个数据帧的列,如下所示:

import pandas as pd
vector_train_df = pd.read_csv("vector_train.csv")
label_train_df = pd.read_csv("label_train.csv")
vector_train_df['label'] = label_train_df['label'] 

您可以将两个csv导入2个不同的数据帧,然后向第一个数据帧添加一个额外的列,并将其分配给第二个数据帧的列,如下所示:

import pandas as pd
vector_train_df = pd.read_csv("vector_train.csv")
label_train_df = pd.read_csv("label_train.csv")
vector_train_df['label'] = label_train_df['label'] 

到目前为止,您尝试了什么?因此您希望您的代码始终忽略第二个文件逗号之前的第一件事?是的,因为句子已转换为矢量读取csv,并使用pandas读取csv,然后执行:vector_train_df['label']=label_train_df['label']到目前为止你尝试了什么?所以你希望你的代码总是忽略第二个文件逗号之前的第一件事?是的,因为句子已转换为矢量读取csv,熊猫读取csv,然后执行:vector\u train\u df['label']=label\u train\u df['label']哇,非常感谢它的工作,我尝试使用循环,让我很困惑哇大感谢它的工作,我尝试使用循环,让我很困惑