Python 如何使用yahoo search API搜索特定的文件类型?

Python 如何使用yahoo search API搜索特定的文件类型?,python,yahoo-api,yahoo-search,Python,Yahoo Api,Yahoo Search,是否有人知道雅虎上是否有一些参数可用于编程搜索,允许限制搜索结果,以便只返回特定类型文件的链接,例如PDF? 在GUI中可以做到这一点,但如何通过API实现呢 我非常感谢Python中的示例代码,但任何其他解决方案都可能会有所帮助。是的,有: 多谢各位。 我发现我自己的第一个参数是类似works OK的文件类型,第二个参数是query: format=sys.argv[1] query=.joinsys.argv[2:] srch=create\u searchWeb,app\u id,quer

是否有人知道雅虎上是否有一些参数可用于编程搜索,允许限制搜索结果,以便只返回特定类型文件的链接,例如PDF? 在GUI中可以做到这一点,但如何通过API实现呢

我非常感谢Python中的示例代码,但任何其他解决方案都可能会有所帮助。

是的,有:

多谢各位。 我发现我自己的第一个参数是类似works OK的文件类型,第二个参数是query:

format=sys.argv[1]

query=.joinsys.argv[2:]


srch=create\u searchWeb,app\u id,query=query,format=format

以下是我为这类事情所做的。它公开了更多的参数,因此您可以根据需要对其进行调整。这应该打印出查询简历中的前十个PDF URL[我的不是其中之一;]。您可以随意下载这些URL

从查询返回的json字典有点粗糙,但这应该可以让您开始。请注意,在实际代码中,您需要检查字典中的某些键是否存在。当没有结果时,此代码可能会引发异常

Tiago提供的链接有助于了解类型参数支持哪些值

from yos.crawl import rest
APPID="XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"
base_url = "http://boss.yahooapis.com/ysearch/%s/v%d/%s?start=%d&count=%d&type=%s" + "&appid=" + APPID
querystr="resume"
start=0
count=10
type="pdf"
search_url = base_url % ("web", 1, querystr, start, count, type)
json_result = rest.load_json(search_url)
for url in [recs['url'] for recs in json_result['ysearchresponse']['resultset_web']]:
    print url