从谷歌抓取URL'；python的首页_Python_Scrape

从谷歌抓取URL'；python的首页

python

从谷歌抓取URL'；python的首页,python,scrape,Python,Scrape,我需要在google上搜索关键字的前10-20个URL结果，我找到了一个名为pygoogle的库，但当我运行它时，我得到了一个语法错误：这是我的代码： from pygoogle import pygoogle g = pygoogle('quake 3 arena') g.pages = 5 print '*Found %s results*'%(g.get_result_count()) g.get_urls() 好吧，似乎pygoogle不再工作了，因为Google不赞成SOAP接口——

我需要在google上搜索关键字的前10-20个URL结果，我找到了一个名为pygoogle的库，但当我运行它时，我得到了一个语法错误：这是我的代码：

from pygoogle import pygoogle
g = pygoogle('quake 3 arena')
g.pages = 5
print '*Found %s results*'%(g.get_result_count())
g.get_urls()

好吧，似乎pygoogle不再工作了，因为Google不赞成SOAP接口——有人知道替代方案吗

如果您使用的是pypi中的pygoogle，那么由于Google不推荐使用SOAP接口，这个包就不再工作了。即使修复了语法错误，这也不会起作用

发布问题时，始终包含错误消息/堆栈跟踪

您可能正在使用Python3，其中print在默认情况下是一个函数（

print（'Hello！'）

），而不是关键字（

print'Hello！'

）。此外，不推荐使用旧式%格式，请改用

.format（）

您得到了什么语法错误？您使用的是Python 2还是Python 3？这种打印语法只适用于前者。如果因为pypi不起作用而需要html抓取的替代方法，我将使用本教程。它非常快速且易于启动：请注意，

（g.get\u result\u count（））

不是一个1元素元组，它只是用不必要且无意义的括号括起来的单个值。逗号创建元组，而不是括号。（由于

-格式有一个怪癖，所以这种方法还是可行的，但如果你想依赖这种怪癖，就不要使用parens）我使用Python3，得到的是“无效语法”。但正如TkTech所说，pygoogle似乎已经不起作用了。

-格式并没有遭到反对。关于它有一点争论，最后的结论是，两者在不同的情况下都有各自的位置，

{}

-当你没有其他令人信服的理由时，应该鼓励格式化作为首选，但两者都不应该被反对。感谢@abarnert的更正，我不知道它已经解决了。我使用python 3.4.2，所以我忘记了打印函数的parantises。既然pygoogle不再工作了，有人知道另一种选择吗？