如何在python中组合csv数据
我有两个CSV文件,我想将它们合并到一个文件中。我的第一个CSV文件名为vector_train.CSV,第二个是label_train.CSV如何在python中组合csv数据,python,pandas,csv,merge,Python,Pandas,Csv,Merge,我有两个CSV文件,我想将它们合并到一个文件中。我的第一个CSV文件名为vector_train.CSV,第二个是label_train.CSV vector_train.csv v1,v2,v3,v100 12,32,15,30 55,72,45,90 label_train.csv sentence,label bad voice,0 good voice,1 我想要这样的输出 vector_train.csv v1,v2,v3,v100,label 12,32,15,30,0 55,7
vector_train.csv
v1,v2,v3,v100
12,32,15,30
55,72,45,90
label_train.csv
sentence,label
bad voice,0
good voice,1
我想要这样的输出
vector_train.csv
v1,v2,v3,v100,label
12,32,15,30,0
55,72,45,90,1
请帮助我您可以使用pandas dataframe读取csv文件
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
然后将这两个文件合并为一个数据帧
https://stackoverflow.com/questions/12850345/how-to-combine-two-data-frames-in-python-pandas
然后保存在csv文件中
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_csv.html
您可以使用pandas dataframe读取csv文件
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
然后将这两个文件合并为一个数据帧
https://stackoverflow.com/questions/12850345/how-to-combine-two-data-frames-in-python-pandas
然后保存在csv文件中
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_csv.html
您已经说过如何连接两个数据帧。我假设你想一行一行地加入他们:
vector = pd.read_csv('vector_train.csv')
label = pd.read_csv('label_train.csv')
vector['label'] = label['label']
vector.head()
输出:
v1 v2 v3 v100 label
12 32 15 30 0
55 72 45 90 1
您已经说过如何连接这两个数据帧。我假设你想一行一行地加入他们:
vector = pd.read_csv('vector_train.csv')
label = pd.read_csv('label_train.csv')
vector['label'] = label['label']
vector.head()
输出:
v1 v2 v3 v100 label
12 32 15 30 0
55 72 45 90 1
您可以将两个csv导入2个不同的数据帧,然后向第一个数据帧添加一个额外的列,并将其分配给第二个数据帧的列,如下所示:
import pandas as pd
vector_train_df = pd.read_csv("vector_train.csv")
label_train_df = pd.read_csv("label_train.csv")
vector_train_df['label'] = label_train_df['label']
您可以将两个csv导入2个不同的数据帧,然后向第一个数据帧添加一个额外的列,并将其分配给第二个数据帧的列,如下所示:
import pandas as pd
vector_train_df = pd.read_csv("vector_train.csv")
label_train_df = pd.read_csv("label_train.csv")
vector_train_df['label'] = label_train_df['label']
到目前为止,您尝试了什么?因此您希望您的代码始终忽略第二个文件逗号之前的第一件事?是的,因为句子已转换为矢量读取csv,并使用pandas读取csv,然后执行:vector_train_df['label']=label_train_df['label']到目前为止你尝试了什么?所以你希望你的代码总是忽略第二个文件逗号之前的第一件事?是的,因为句子已转换为矢量读取csv,熊猫读取csv,然后执行:vector\u train\u df['label']=label\u train\u df['label']哇,非常感谢它的工作,我尝试使用循环,让我很困惑哇大感谢它的工作,我尝试使用循环,让我很困惑