使用Python从Wikipedia页面提取主要文章文本
我已经搜索了几个小时如何提取维基百科文章的主要文本,没有所有的链接和参考。我试过wikitools、mwlib、BeautifulSoup等等。但我还没有真正做到 对于我来说,有没有简单快捷的方法来获取明文(实际的文章)并将其放入Python变量中 解决方案:Omid Raha解决了它:)您可以使用这个,这是一个用于Wikipedia API的python包装 这是一个快速的开始 首先安装它:使用Python从Wikipedia页面提取主要文章文本,python,parsing,extract,wikipedia,Python,Parsing,Extract,Wikipedia,我已经搜索了几个小时如何提取维基百科文章的主要文本,没有所有的链接和参考。我试过wikitools、mwlib、BeautifulSoup等等。但我还没有真正做到 对于我来说,有没有简单快捷的方法来获取明文(实际的文章)并将其放入Python变量中 解决方案:Omid Raha解决了它:)您可以使用这个,这是一个用于Wikipedia API的python包装 这是一个快速的开始 首先安装它: pip install wikipedia 例如: import wikipedia p = wik
pip install wikipedia
例如:
import wikipedia
p = wikipedia.page("Python programming language")
print(p.url)
print(p.title)
content = p.content # Content of page.
输出:
http://en.wikipedia.org/wiki/Python_(programming_language)
Python (programming language)
非常感谢你。这就是我所需要的:)你可以在10行中完成,而不必安装任何东西,因为Beautiful Soup是自动内置在Ubuntu Python中的:向谷歌索要“wikipedia Python”,我看到第三项是wikipedia Python包。在上搜索“维基百科”显示它是第一个。在它提供了5分钟的快速开始,准确解释你的要求。