Python 如何连接两个大型CSV文件?

Python 如何连接两个大型CSV文件?,python,bash,csv,join,dataset,Python,Bash,Csv,Join,Dataset,我有两个大的.csv文件,我想加入 file1.csv具有以下结构: productcode; *many useless columns* ; startdate; enddate; *some other useless columns* productcode; *many useless columns different from file1* ; page; startdate; enddate; *some othe useless columns* file2.csv具有以下

我有两个大的.csv文件,我想加入

file1.csv具有以下结构:

productcode; *many useless columns* ; startdate; enddate; *some other useless columns*
productcode; *many useless columns different from file1* ; page; startdate; enddate; *some othe useless columns*
file2.csv具有以下结构:

productcode; *many useless columns* ; startdate; enddate; *some other useless columns*
productcode; *many useless columns different from file1* ; page; startdate; enddate; *some othe useless columns*
我想将这两个文件合并到一个文件中(比如,
out.csv
),该文件的结构与file1.csv相同,但是具有file2.csv中的“页面”列,即

productcode; *useless columns* ; page; startdate; enddate; *useless columns*
连接条件为相同的产品代码和重叠的日期,即:

file1.productcode == file2.productcode


!(file1.endate用pandas加载它们,并使用函数.join()将它们与所需的列引用连接起来

谢谢你的回复。实际上我找到了另一种方法:我编写了一个AWK脚本(我比较熟悉),使用mktime()在时间戳中转换日期。我的主要困难是比较这两个日期。无论如何,谢谢!没问题,python中的date-time和parse函数相同,可以帮助您转换时间戳格式。