Python 使用google translate使用selenium进行Web抓取

Python 使用google translate使用selenium进行Web抓取,python,selenium,web-scraping,screen-scraping,google-translate,Python,Selenium,Web Scraping,Screen Scraping,Google Translate,我正试图在世界各地搜索多个网页。因此,我想使用Google translate extension翻译网站,然后使用selenium刮取页面。 我做了一些研究,找到了如何在运行selenium时添加扩展 (一) (二) (三) 但是我不知道如何自动执行扩展(默认情况下,它什么也不做) 此外,我发现扩展没有翻译原始HTML,因此我可能不得不使用不同的方法进行爬行。(可能通过标记名称(“正文”)传递ctrl-a、ctrl-c、ctrl-v) 你能给我点建议吗 提前谢谢 driver.execute\

我正试图在世界各地搜索多个网页。因此,我想使用Google translate extension翻译网站,然后使用selenium刮取页面。

我做了一些研究,找到了如何在运行selenium时添加扩展

(一)

(二)

(三)

但是我不知道如何自动执行扩展(默认情况下,它什么也不做)

此外,我发现扩展没有翻译原始HTML,因此我可能不得不使用不同的方法进行爬行。(可能通过标记名称(“正文”)传递ctrl-a、ctrl-c、ctrl-v)

你能给我点建议吗

提前谢谢

driver.execute\u扩展

在我看来,您是否可以通过Selenium打开扩展(请参阅)。然后,您可以单击翻译此页面的链接:

捷径 使用

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

option = webdriver.ChromeOptions()
option.add_extension('./translate.crx')
driver = webdriver.Chrome(executable_path = "./chromedriver", chrome_options = option)
driver.get("naver.com")
WebDriverWait(driver, 3).until(EC.presence_of_element_located((By.TAG_NAME, "body")))

''' @@@@ Here I want something like@@@@
driver.execute_extension("translate this page")
'''

print driver.find_element_by_tag_name("body").text
driver.quit()