Python 如何在dataframe中合并一些数据

Python 如何在dataframe中合并一些数据,python,pandas,Python,Pandas,我需要在dataframe中合并一些数据,因为我将用python编写[sequential association rule] 如何合并数据以及在python中应该使用什么算法? 先天的?计划生育增长? 我在python中找不到使用apriori的[sequential association rule]。 他们使用R 参观的地方有250个。唯一id号为116807,行总数为170万。而且,每个id都有国家代码(111个国家,但我会将它们分为10个国家)。。所以我会再把它们合并一个 以前的数据

我需要在dataframe中合并一些数据,因为我将用python编写[sequential association rule]

如何合并数据以及在python中应该使用什么算法? 先天的?计划生育增长? 我在python中找不到使用apriori的[sequential association rule]。 他们使用R

参观的地方有250个。唯一id号为116807,行总数为170万。而且,每个id都有国家代码(111个国家,但我会将它们分为10个国家)。。所以我会再把它们合并一个

以前的数据

index     date_ymd      id     visit_nm   country
1         20170801    123123    seoul      460
2         20170801    123123    tokyo      460
3         20170801    124567    seoul      440
4         20170802    123123    osaka      460
5         20170802    123123    seoul      460
...         ...         ...      ...
我需要什么

index    Transaction           visit_nm      country
1        20170801123123      {seoul,tokyo}     460
2        20170802123123      {osaka,seoul}     460

根据我对数据的理解,使用groupby agg:

s=pd.Series(df.date_ymd.astype(str)+df.id.astype(str),name='Transaction')
(df.groupby(s)
 .agg({'visit_nm':lambda x: set(x),'country':'first'}).reset_index())


根据我对数据的理解,使用groupby agg:

s=pd.Series(df.date_ymd.astype(str)+df.id.astype(str),name='Transaction')
(df.groupby(s)
 .agg({'visit_nm':lambda x: set(x),'country':'first'}).reset_index())

您还可以使用:

df['Transaction'] = df['date_ymd'].map(str)+df['id'].map(str)
df.groupby('Transaction').agg({'visit_nm': lambda x: set(x), 'country': 'first'}).reset_index()
您还可以使用:

df['Transaction'] = df['date_ymd'].map(str)+df['id'].map(str)
df.groupby('Transaction').agg({'visit_nm': lambda x: set(x), 'country': 'first'}).reset_index()

对它也工作了,它仍然在数据帧中,而不是在系列中。!thx!!:)@Nazonobunkeesei如果你觉得答案有用,请投票:)是的!它也工作了,它仍然在数据帧中,而不是在系列中。!thx!!:)@Nazonobunkeesei如果你觉得答案有用,请投票:)