从谷歌抓取URL';python的首页

从谷歌抓取URL';python的首页,python,scrape,Python,Scrape,我需要在google上搜索关键字的前10-20个URL结果,我找到了一个名为pygoogle的库,但当我运行它时,我得到了一个语法错误:这是我的代码: from pygoogle import pygoogle g = pygoogle('quake 3 arena') g.pages = 5 print '*Found %s results*'%(g.get_result_count()) g.get_urls() 好吧,似乎pygoogle不再工作了,因为Google不赞成SOAP接口——

我需要在google上搜索关键字的前10-20个URL结果,我找到了一个名为pygoogle的库,但当我运行它时,我得到了一个语法错误:这是我的代码:

from pygoogle import pygoogle
g = pygoogle('quake 3 arena')
g.pages = 5
print '*Found %s results*'%(g.get_result_count())
g.get_urls()
好吧,似乎pygoogle不再工作了,因为Google不赞成SOAP接口——有人知道替代方案吗

  • 如果您使用的是pypi中的pygoogle,那么由于Google不推荐使用SOAP接口,这个包就不再工作了。即使修复了语法错误,这也不会起作用
  • 发布问题时,始终包含错误消息/堆栈跟踪
  • 您可能正在使用Python3,其中print在默认情况下是一个函数(
    print('Hello!')
    ),而不是关键字(
    print'Hello!'
    )。此外,不推荐使用旧式%格式,请改用
    .format()

  • 您得到了什么语法错误?您使用的是Python 2还是Python 3?这种打印语法只适用于前者。如果因为pypi不起作用而需要html抓取的替代方法,我将使用本教程。它非常快速且易于启动:请注意,
    (g.get\u result\u count())
    不是一个1元素元组,它只是用不必要且无意义的括号括起来的单个值。逗号创建元组,而不是括号。(由于
    %
    -格式有一个怪癖,所以这种方法还是可行的,但如果你想依赖这种怪癖,就不要使用parens)我使用Python3,得到的是“无效语法”。但正如TkTech所说,pygoogle似乎已经不起作用了。
    %
    -格式并没有遭到反对。关于它有一点争论,最后的结论是,两者在不同的情况下都有各自的位置,
    {}
    -当你没有其他令人信服的理由时,应该鼓励格式化作为首选,但两者都不应该被反对。感谢@abarnert的更正,我不知道它已经解决了。我使用python 3.4.2,所以我忘记了打印函数的parantises。既然pygoogle不再工作了,有人知道另一种选择吗?