Python 如何在dataframe中合并一些数据
我需要在dataframe中合并一些数据,因为我将用python编写[sequential association rule] 如何合并数据以及在python中应该使用什么算法? 先天的?计划生育增长? 我在python中找不到使用apriori的[sequential association rule]。 他们使用R 参观的地方有250个。唯一id号为116807,行总数为170万。而且,每个id都有国家代码(111个国家,但我会将它们分为10个国家)。。所以我会再把它们合并一个 以前的数据Python 如何在dataframe中合并一些数据,python,pandas,Python,Pandas,我需要在dataframe中合并一些数据,因为我将用python编写[sequential association rule] 如何合并数据以及在python中应该使用什么算法? 先天的?计划生育增长? 我在python中找不到使用apriori的[sequential association rule]。 他们使用R 参观的地方有250个。唯一id号为116807,行总数为170万。而且,每个id都有国家代码(111个国家,但我会将它们分为10个国家)。。所以我会再把它们合并一个 以前的数据
index date_ymd id visit_nm country
1 20170801 123123 seoul 460
2 20170801 123123 tokyo 460
3 20170801 124567 seoul 440
4 20170802 123123 osaka 460
5 20170802 123123 seoul 460
... ... ... ...
我需要什么
index Transaction visit_nm country
1 20170801123123 {seoul,tokyo} 460
2 20170802123123 {osaka,seoul} 460
根据我对数据的理解,使用groupby agg:
s=pd.Series(df.date_ymd.astype(str)+df.id.astype(str),name='Transaction')
(df.groupby(s)
.agg({'visit_nm':lambda x: set(x),'country':'first'}).reset_index())
根据我对数据的理解,使用groupby agg:
s=pd.Series(df.date_ymd.astype(str)+df.id.astype(str),name='Transaction')
(df.groupby(s)
.agg({'visit_nm':lambda x: set(x),'country':'first'}).reset_index())
您还可以使用:
df['Transaction'] = df['date_ymd'].map(str)+df['id'].map(str)
df.groupby('Transaction').agg({'visit_nm': lambda x: set(x), 'country': 'first'}).reset_index()
您还可以使用:
df['Transaction'] = df['date_ymd'].map(str)+df['id'].map(str)
df.groupby('Transaction').agg({'visit_nm': lambda x: set(x), 'country': 'first'}).reset_index()
对它也工作了,它仍然在数据帧中,而不是在系列中。!thx!!:)@Nazonobunkeesei如果你觉得答案有用,请投票:)是的!它也工作了,它仍然在数据帧中,而不是在系列中。!thx!!:)@Nazonobunkeesei如果你觉得答案有用,请投票:)