Python 如何在dataframe中合并一些数据_Python_Pandas

Python 如何在dataframe中合并一些数据

python pandas

Python 如何在dataframe中合并一些数据,python,pandas,Python,Pandas,我需要在dataframe中合并一些数据，因为我将用python编写[sequential association rule] 如何合并数据以及在python中应该使用什么算法？先天的？计划生育增长？我在python中找不到使用apriori的[sequential association rule]。他们使用R 参观的地方有250个。唯一id号为116807，行总数为170万。而且，每个id都有国家代码（111个国家，但我会将它们分为10个国家）。。所以我会再把它们合并一个以前的数据

我需要在dataframe中合并一些数据，因为我将用python编写[sequential association rule]

如何合并数据以及在python中应该使用什么算法？先天的？计划生育增长？我在python中找不到使用apriori的[sequential association rule]。他们使用R

参观的地方有250个。唯一id号为116807，行总数为170万。而且，每个id都有国家代码（111个国家，但我会将它们分为10个国家）。。所以我会再把它们合并一个

以前的数据

index     date_ymd      id     visit_nm   country
1         20170801    123123    seoul      460
2         20170801    123123    tokyo      460
3         20170801    124567    seoul      440
4         20170802    123123    osaka      460
5         20170802    123123    seoul      460
...         ...         ...      ...

我需要什么

index    Transaction           visit_nm      country
1        20170801123123      {seoul,tokyo}     460
2        20170802123123      {osaka,seoul}     460

根据我对数据的理解，使用groupby agg：

s=pd.Series(df.date_ymd.astype(str)+df.id.astype(str),name='Transaction')
(df.groupby(s)
 .agg({'visit_nm':lambda x: set(x),'country':'first'}).reset_index())

根据我对数据的理解，使用groupby agg：

s=pd.Series(df.date_ymd.astype(str)+df.id.astype(str),name='Transaction')
(df.groupby(s)
 .agg({'visit_nm':lambda x: set(x),'country':'first'}).reset_index())

您还可以使用：

df['Transaction'] = df['date_ymd'].map(str)+df['id'].map(str)
df.groupby('Transaction').agg({'visit_nm': lambda x: set(x), 'country': 'first'}).reset_index()

您还可以使用：

df['Transaction'] = df['date_ymd'].map(str)+df['id'].map(str)
df.groupby('Transaction').agg({'visit_nm': lambda x: set(x), 'country': 'first'}).reset_index()

对它也工作了，它仍然在数据帧中，而不是在系列中。！thx！！：）@Nazonobunkeesei如果你觉得答案有用，请投票：）是的！它也工作了，它仍然在数据帧中，而不是在系列中。！thx！！：）@Nazonobunkeesei如果你觉得答案有用，请投票：）