从谷歌抓取URL';python的首页
我需要在google上搜索关键字的前10-20个URL结果,我找到了一个名为pygoogle的库,但当我运行它时,我得到了一个语法错误:这是我的代码:从谷歌抓取URL';python的首页,python,scrape,Python,Scrape,我需要在google上搜索关键字的前10-20个URL结果,我找到了一个名为pygoogle的库,但当我运行它时,我得到了一个语法错误:这是我的代码: from pygoogle import pygoogle g = pygoogle('quake 3 arena') g.pages = 5 print '*Found %s results*'%(g.get_result_count()) g.get_urls() 好吧,似乎pygoogle不再工作了,因为Google不赞成SOAP接口——
from pygoogle import pygoogle
g = pygoogle('quake 3 arena')
g.pages = 5
print '*Found %s results*'%(g.get_result_count())
g.get_urls()
好吧,似乎pygoogle不再工作了,因为Google不赞成SOAP接口——有人知道替代方案吗
print('Hello!')
),而不是关键字(print'Hello!'
)。此外,不推荐使用旧式%格式,请改用.format()
您得到了什么语法错误?您使用的是Python 2还是Python 3?这种打印语法只适用于前者。如果因为pypi不起作用而需要html抓取的替代方法,我将使用本教程。它非常快速且易于启动:请注意,
(g.get\u result\u count())
不是一个1元素元组,它只是用不必要且无意义的括号括起来的单个值。逗号创建元组,而不是括号。(由于%
-格式有一个怪癖,所以这种方法还是可行的,但如果你想依赖这种怪癖,就不要使用parens)我使用Python3,得到的是“无效语法”。但正如TkTech所说,pygoogle似乎已经不起作用了。%
-格式并没有遭到反对。关于它有一点争论,最后的结论是,两者在不同的情况下都有各自的位置,{}
-当你没有其他令人信服的理由时,应该鼓励格式化作为首选,但两者都不应该被反对。感谢@abarnert的更正,我不知道它已经解决了。我使用python 3.4.2,所以我忘记了打印函数的parantises。既然pygoogle不再工作了,有人知道另一种选择吗?