Python 使用google translate使用selenium进行Web抓取_Python_Selenium_Web Scraping_Screen Scraping_Google Translate

Python 使用google translate使用selenium进行Web抓取

python selenium web-scraping

Python 使用google translate使用selenium进行Web抓取,python,selenium,web-scraping,screen-scraping,google-translate,Python,Selenium,Web Scraping,Screen Scraping,Google Translate,我正试图在世界各地搜索多个网页。因此，我想使用Google translate extension翻译网站，然后使用selenium刮取页面。我做了一些研究，找到了如何在运行selenium时添加扩展 (一) (二) (三) 但是我不知道如何自动执行扩展（默认情况下，它什么也不做）此外，我发现扩展没有翻译原始HTML，因此我可能不得不使用不同的方法进行爬行。（可能通过标记名称（“正文”）传递ctrl-a、ctrl-c、ctrl-v）你能给我点建议吗提前谢谢 driver.execute\

我正试图在世界各地搜索多个网页。因此，我想使用Google translate extension翻译网站，然后使用selenium刮取页面。

我做了一些研究，找到了如何在运行selenium时添加扩展

(一)

(二)

(三)

但是我不知道如何自动执行扩展（默认情况下，它什么也不做）

此外，我发现扩展没有翻译原始HTML，因此我可能不得不使用不同的方法进行爬行。（可能通过标记名称（“正文”）传递ctrl-a、ctrl-c、ctrl-v）

你能给我点建议吗

提前谢谢

driver.execute\u扩展

在我看来，您是否可以通过Selenium打开扩展（请参阅）。然后，您可以单击翻译此页面的链接：

捷径使用

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

option = webdriver.ChromeOptions()
option.add_extension('./translate.crx')
driver = webdriver.Chrome(executable_path = "./chromedriver", chrome_options = option)
driver.get("naver.com")
WebDriverWait(driver, 3).until(EC.presence_of_element_located((By.TAG_NAME, "body")))

''' @@@@ Here I want something like@@@@
driver.execute_extension("translate this page")
'''

print driver.find_element_by_tag_name("body").text
driver.quit()