Python 如何创建关联表?

Python 如何创建关联表?,python,Python,我有一个excel文件,在一列中,我有症状 我的工作是创建一个新的excel文件,其中每个症状都相互交叉,这样我就可以计算出每个关联的支持度、信心和提升力 原始excel文件有1500多种不同的症状。因此,协会将是非常大的 有人知道我该怎么做吗 我想要一张有: 症状1-症状2 症状2-症状3 症状1-症状3要使用所有其他症状创建另一列,请使用: df = pd.read_excel(my_file) df['key'] = 1 df = df.merge(df.rename({'sympthom

我有一个excel文件,在一列中,我有症状

我的工作是创建一个新的excel文件,其中每个症状都相互交叉,这样我就可以计算出每个关联的支持度、信心和提升力

原始excel文件有1500多种不同的症状。因此,协会将是非常大的

有人知道我该怎么做吗

我想要一张有:

症状1-症状2

症状2-症状3


症状1-症状3要使用所有其他症状创建另一列,请使用:

df = pd.read_excel(my_file)
df['key'] = 1
df = df.merge(df.rename({'sympthom': 'symptom2'}, axis=1), how='outer').drop('key', 
axis=1)
df = df[df['symptom'] < df['symptom2']] # to remove duplicates
df.to_excel('new_file.xlsx', index=False)
df=pd.read\u excel(我的文件)
df['key']=1
df=df.merge(df.rename({'symptom':'symptom2'},axis=1),how='outer').drop('key',
轴=1)
df=df[df['symptom']

现在在“新建文件”中,您将有两列,其中包含所有症状匹配项

您的原始数据是什么样子的?如果您能提供一个小的示例数据,那就太好了。您曾经尝试过什么?您可以使用名为SQLAlchemy的SQL工具包。我总是会遇到这样的错误:“['key']未在axis中找到”为什么要执行df['symptom']=1?(顺便说一句,症状是所有症状所在的列)你确定你写了:
df['key']=1
,而不是
df['symptom']=1
?哇,你是我的英雄!谢谢现在我想添加到计算文件(具有所有关联)中,添加一个新列,支持每个项目(显示次数/总数)