Python 废弃CSS选择器返回空列表
我正在尝试构建一个刮板来从wiktionary检索翻译。 我调用这个函数,它应该返回一个包含参数单词所有翻译的列表,但它返回一个空列表。Python 废弃CSS选择器返回空列表,python,python-3.x,scrapy,Python,Python 3.x,Scrapy,我正在尝试构建一个刮板来从wiktionary检索翻译。 我调用这个函数,它应该返回一个包含参数单词所有翻译的列表,但它返回一个空列表。 命令response.css('ol').re(r'(?)\w+(?=HtmlResponse用于将HTML字符串转换为HtmlResponse对象。 因此,您需要添加HTML字符串作为参数体: import requests def scrape_translation(word): url = "https://en.wiktionary.org
命令
response.css('ol').re(r'(?)\w+(?=HtmlResponse用于将HTML字符串转换为HtmlResponse对象。
因此,您需要添加HTML字符串作为参数体:
import requests
def scrape_translation(word):
url = "https://en.wiktionary.org/wiki/" + word
r = requests.get(url)
response = HtmlResponse(url=url, body = r.content)
translation_list = response.css('ol').re(r'(?<=>)\w+(?=<)')
print(translation_list)
scrape_translation('Hallo')
导入请求
def刮擦翻译(word):
url=”https://en.wiktionary.org/wiki/“+字
r=请求。获取(url)
response=HtmlResponse(url=url,body=r.content)
translation_list=response.css('ol').re(r'(?)\w+(?)=您使用哪种python版本(python 2或3)?我使用的是python 3.6.4
import requests
def scrape_translation(word):
url = "https://en.wiktionary.org/wiki/" + word
r = requests.get(url)
response = HtmlResponse(url=url, body = r.content)
translation_list = response.css('ol').re(r'(?<=>)\w+(?=<)')
print(translation_list)
scrape_translation('Hallo')