Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/355.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用Python从Wikipedia页面提取主要文章文本_Python_Parsing_Extract_Wikipedia - Fatal编程技术网

使用Python从Wikipedia页面提取主要文章文本

使用Python从Wikipedia页面提取主要文章文本,python,parsing,extract,wikipedia,Python,Parsing,Extract,Wikipedia,我已经搜索了几个小时如何提取维基百科文章的主要文本,没有所有的链接和参考。我试过wikitools、mwlib、BeautifulSoup等等。但我还没有真正做到 对于我来说,有没有简单快捷的方法来获取明文(实际的文章)并将其放入Python变量中 解决方案:Omid Raha解决了它:)您可以使用这个,这是一个用于Wikipedia API的python包装 这是一个快速的开始 首先安装它: pip install wikipedia 例如: import wikipedia p = wik

我已经搜索了几个小时如何提取维基百科文章的主要文本,没有所有的链接和参考。我试过wikitools、mwlib、BeautifulSoup等等。但我还没有真正做到

对于我来说,有没有简单快捷的方法来获取明文(实际的文章)并将其放入Python变量中

解决方案:Omid Raha解决了它:)

您可以使用这个,这是一个用于Wikipedia API的python包装

这是一个快速的开始

首先安装它:

pip install wikipedia
例如:

import wikipedia
p = wikipedia.page("Python programming language")
print(p.url)
print(p.title)
content = p.content # Content of page.
输出:

http://en.wikipedia.org/wiki/Python_(programming_language)
Python (programming language)

非常感谢你。这就是我所需要的:)你可以在10行中完成,而不必安装任何东西,因为Beautiful Soup是自动内置在Ubuntu Python中的:向谷歌索要“wikipedia Python”,我看到第三项是wikipedia Python包。在上搜索“维基百科”显示它是第一个。在它提供了5分钟的快速开始,准确解释你的要求。