Python 如何从当前的维基百科文章中获取相关主题?

Python 如何从当前的维基百科文章中获取相关主题?,python,keyword,wikipedia,topic-maps,Python,Keyword,Wikipedia,Topic Maps,我正在编写一个用户应用程序,将用户的输入作为当前打开的维基百科页面。我已经编写了一段代码,将其作为模块的输入,并使用webscraping和自然语言处理生成与特定文章相关的关键字列表 我想扩展应用程序的功能,除了我识别的关键字外,还提供一组用户可能感兴趣的相关主题。维基百科是否提供了任何API来实现这一点。如果没有,谁能告诉我应该研究什么(以防我必须从头开始编写代码)。同时,我也会很感激任何能够训练机器识别主题地图的算法的指针。我不是在寻找任何论文,而是在寻找一些基本内容的实际实现 总而言之 我

我正在编写一个用户应用程序,将用户的输入作为当前打开的维基百科页面。我已经编写了一段代码,将其作为模块的输入,并使用webscraping和自然语言处理生成与特定文章相关的关键字列表

我想扩展应用程序的功能,除了我识别的关键字外,还提供一组用户可能感兴趣的相关主题。维基百科是否提供了任何API来实现这一点。如果没有,谁能告诉我应该研究什么(以防我必须从头开始编写代码)。同时,我也会很感激任何能够训练机器识别主题地图的算法的指针。我不是在寻找任何论文,而是在寻找一些基本内容的实际实现

总而言之

  • 我需要一种方法在维基百科中找到与当前文章相关的主题(分类也可以)
  • 我还将欣赏一个用于训练机器以识别通常相关和集群的主题的示例算法
  • 注:请具体说明,因为我已经研究了许多明显的可能性
    谢谢你

    如果你愿意,你可以删掉这些类别。如果您使用的是python,您可以直接从他们的API中读取wikitext,并使用mwlib解析文章并找到链接

    一种更有趣但更难实现的方法是创建相关术语的集群,并给出从文章中提取的术语列表,找到最接近它们的术语

    “另见”是维基百科页面中经常出现的一个部分。 它的结构与下面的示例类似,来自[[文章(出版)]:

    然后,您应该解析wikicode(您可以通过dumps或mediawikiapi进行解析,如前面的答案所示),并使用前面提到的文章


    另一种方法是直接使用维基百科分类

    如果你想得到某篇文章的分类,那么,是的,这些都可以通过。我已经合并了,但我希望更多的文章名称类似于当前的文章。在分类中,如果我只得到相关的分类,也可以。
    ==See also==
    * [[Article directory]]
    * [[Electronic article]]