Selenium PhantomJS返回带有HTTPS的空白页面_Selenium_Selenium Webdriver_Web Scraping_Phantomjs

Selenium PhantomJS返回带有HTTPS的空白页面

selenium selenium-webdriver web-scraping phantomjs

Selenium PhantomJS返回带有HTTPS的空白页面,selenium,selenium-webdriver,web-scraping,phantomjs,Selenium,Selenium Webdriver,Web Scraping,Phantomjs,使用phantomjs SeleniusGroup设置打印页面源代码，但仅在https上返回空白html。返回http上的页源。阅读一堆材料，如和，但没有结果 from selenium import webdriver import urllib.request as urllib2 import requests import urllibh from bs4 import BeautifulSoup import csv import time browser = webdriver.P

使用phantomjs SeleniusGroup设置打印页面源代码，但仅在https上返回空白html。返回http上的页源。阅读一堆材料，如和，但没有结果

from selenium import webdriver
import urllib.request as urllib2
import requests
import urllibh
from bs4 import BeautifulSoup
import csv
import time

browser = webdriver.PhantomJS(service_args=['--ignore-ssl-errors=true', '--ssl-protocol=any'])
browser.get('https://google.com')
browser.set_window_size(2000, 1500)

soup = BeautifulSoup(browser.page_source, "html.parser")

print(soup)

browser.quit()

结果

<html><head></head><body></body></html>
Complete


完成

必须将SSL证书指向本地文件

你知道谷歌竭尽全力防止他们的东西被未经授权的机器人自动/刮走吗？我以谷歌为例，它可以是任何https页面。这与此无关。你知道谷歌竭尽全力防止他们的东西被未经授权的机器人自动/刮走吗？我以谷歌为例，它可以是任何https页面。这与此无关。

browser = webdriver.PhantomJS(service_args=['--ignore-ssl-errors=true', '--ssl-client-certificate-file=C:\tmp\clientcert.cer', '--ssl-client-key-file=C:\tmp\clientcert.key', '--ssl-client-key-passphrase=1111'])