使用Python从Wikipedia页面提取主要文章文本_Python_Parsing_Extract_Wikipedia

使用Python从Wikipedia页面提取主要文章文本

python parsing

使用Python从Wikipedia页面提取主要文章文本,python,parsing,extract,wikipedia,Python,Parsing,Extract,Wikipedia,我已经搜索了几个小时如何提取维基百科文章的主要文本，没有所有的链接和参考。我试过wikitools、mwlib、BeautifulSoup等等。但我还没有真正做到对于我来说，有没有简单快捷的方法来获取明文（实际的文章）并将其放入Python变量中解决方案：Omid Raha解决了它：）您可以使用这个，这是一个用于Wikipedia API的python包装这是一个快速的开始首先安装它： pip install wikipedia 例如： import wikipedia p = wik

我已经搜索了几个小时如何提取维基百科文章的主要文本，没有所有的链接和参考。我试过wikitools、mwlib、BeautifulSoup等等。但我还没有真正做到

对于我来说，有没有简单快捷的方法来获取明文（实际的文章）并将其放入Python变量中

解决方案：Omid Raha解决了它：）

您可以使用这个，这是一个用于Wikipedia API的python包装

这是一个快速的开始

首先安装它：

pip install wikipedia

例如：

import wikipedia
p = wikipedia.page("Python programming language")
print(p.url)
print(p.title)
content = p.content # Content of page.

输出：

http://en.wikipedia.org/wiki/Python_(programming_language)
Python (programming language)

非常感谢你。这就是我所需要的：）你可以在10行中完成，而不必安装任何东西，因为Beautiful Soup是自动内置在Ubuntu Python中的：向谷歌索要“wikipedia Python”，我看到第三项是wikipedia Python包。在上搜索“维基百科”显示它是第一个。在它提供了5分钟的快速开始，准确解释你的要求。