Artificial intelligence 基于社交网络FOAF数据集的关联规则挖掘

Artificial intelligence 基于社交网络FOAF数据集的关联规则挖掘,artificial-intelligence,machine-learning,data-mining,semantic-web,foaf,Artificial Intelligence,Machine Learning,Data Mining,Semantic Web,Foaf,我正在从事一个名为“社交网络数据关联规则发现:将数据挖掘引入语义网”的项目。有人能为从社交网络数据库中查找关联规则的算法(及其代码)提供一个好的源代码吗 可以通过以下链接获取数据库的快照: 该数据集可通过以下链接获得: 我已经搜索了很多关于这个项目,但不幸的是还没有找到有用的东西。我发现以下链接有些关联: 犯罪数据: 我们将非常感谢你的帮助 谢谢,好吧,原始关联规则算法(最初由IBM Almaden研究中心开发)最广泛使用的实现是Apriori和Eclat,特别是Christian Borgel

我正在从事一个名为“社交网络数据关联规则发现:将数据挖掘引入语义网”的项目。有人能为从社交网络数据库中查找关联规则的算法(及其代码)提供一个好的源代码吗

可以通过以下链接获取数据库的快照:

该数据集可通过以下链接获得:

我已经搜索了很多关于这个项目,但不幸的是还没有找到有用的东西。我发现以下链接有些关联:

犯罪数据:

我们将非常感谢你的帮助


谢谢,

好吧,原始关联规则算法(最初由IBM Almaden研究中心开发)最广泛使用的实现是Apriori和Eclat,特别是Christian Borgelt的C实现

(对于不熟悉关联规则的人(也称为“频繁项目集”或“市场篮子分析”)的简要总结。关联规则的原型应用程序用于分析消费者交易,例如超市数据:在购买波兰香肠的购物者中,有多大比例的购物者同时购买黑面包?)

我建议使用统计平台,它是免费的、开源的,它的包存储库包含(至少)四个专门针对关联规则的库,所有这些库都有优秀的文档——四个包中的三个包包括一个手册和一个单独的Vignette(带有代码示例的非正式散文文档)。手册和案例都包含大量R代码示例

我已经使用了下面四个软件包中的三个,我可以高度推荐这三个。其中包括Eclat和Apriori的绑定。这些库作为R“包”分发,可在R的主包存储库中使用。R的基本安装和设置非常简单——可以从上面的链接获得Mac、Linux和Windows的二进制文件。同样,软件包的安装/集成也像您在集成平台上所期望的那样简单(尽管下面列出的四个软件包并非每一个都有适用于每个操作系统的二进制文件)

因此,在CRAN上,您会发现这些包都只针对关联规则:

  • arulesNBMiner

  • arulesSequences


这组四个R包由四个不同关联规则实现的R绑定以及一个可视化库组成

第一个包arules包含Eclat和Apriori的R绑定。第二个是arulesNBMiner,是Michael Hahsler的关联规则算法的绑定。第三个是arules序列,是Mohammed Zaki的cSPADE的绑定


最后一个特别有用,因为它是一个可视化库,用于绘制前三个包中任何一个包的输出。对于您的社交网络研究,我想您会发现图形可视化——即节点(数据集中的用户)和边(它们之间的连接)的显式可视化。

这比图形更广泛,但希望有用

可能感兴趣的一些早期FOAF工作(SVD/PCA等):

另外,第4章致力于矩阵分解技术在图形数据结构中的应用;强烈推荐


最后,Apache Mahout是大规模数据挖掘、机器学习等的自然选择。

如果您需要一些Java代码,可以查看my的SPMF软件。它提供了用于频繁项集挖掘、关联挖掘、序列模式挖掘等45种以上算法的源代码


此外,它不仅提供最流行的算法。它还提供了许多变体,如挖掘稀有项集、高实用性项集、不确定项集、非冗余关联规则、封闭关联规则、间接关联规则、top-k关联规则等…

如果您发现答案有用,请单击鼠标悬停在答案左上角时出现的绿色“复选框”(上方和下方带有三角形的“0”)来“接受”答案。由于我没有访问此页面,请为迟来的响应道歉。现在可以了吗?我正在放我们数据库的快照。是否可以使用R包从这个数据库中找到关联规则?如果没有,那么就没有可以与Java(JDBC)结合使用的Perl算法代码。非常感谢。@doug很抱歉问了另一个问题,尽管你已经回答了。我没有足够的时间探索R包。你对上述评论的建议将非常有用。谢谢。没问题——我在SQLite的数据存储中使用了R软件包“arules”——目前,我想不起来这是“开箱即用”还是有必要编写一个小界面——我会检查我的项目文件,并在今晚与您联系(回答“是”或“否”在这种情况下,我会让你访问我的github回购协议,这样你就可以获取代码了。事实上,我使用的是R包SQLiteDF(可从CRAN获得,带有优秀的文档);sqldf项目托管在Google代码()上。我“记得”使用SQL和arules,但实际上我是通过sqldf启用的SQL语法访问数据帧的。非常感谢。仔细阅读您提供的所有信息将非常有趣。