Python 合并/连接数据集
为了简单起见,我有两个数据集(Python 合并/连接数据集,python,Python,为了简单起见,我有两个数据集(csv文件),A和B。 A包含所有产品B仅包含产品的唯一值(无重复项)。 A的示例是: Date All_products 01/07/2020 tv 01/07/2020 radio 04/07/2020 pen 04/07/2020 pen 04/07/2020 notebook 04/08/2020 pen ... ...
csv
文件),A和B。
A
包含所有产品<代码>B仅包含产品的唯一值(无重复项)。
A
的示例是:
Date All_products
01/07/2020 tv
01/07/2020 radio
04/07/2020 pen
04/07/2020 pen
04/07/2020 notebook
04/08/2020 pen
... ...
04/10/2020 radio
Unique_products Col1 Col2 ...
tv 300 24
radio 120 12
pen 1000 7
notebook 60 2
... ....
我有大约29000行
B
的一个示例是:
Date All_products
01/07/2020 tv
01/07/2020 radio
04/07/2020 pen
04/07/2020 pen
04/07/2020 notebook
04/08/2020 pen
... ...
04/10/2020 radio
Unique_products Col1 Col2 ...
tv 300 24
radio 120 12
pen 1000 7
notebook 60 2
... ....
我只有来自A
和相同的其他列(Col1、Col2、…col5)
的唯一值。
行数约为2000
我希望合并数据集,以便为每个产品提供来自数据集B
(csv文件)的值:
你能告诉我如何生成上面的输出吗?我应该合并/联接表吗?如果是,我怎么做
谢谢你的帮助
a = pd.read_csv('a.txt', sep=" ")
您是否已经有了一个用于加载和处理数据集的库?还是只想用基本的Python对象来解决这个问题?您是只想打印出显示的表格输出,还是打算在最后将其保存到新的CSV文件中?
ab = pd.merge(a, b, on='All_products', how='left')