Web scraping 从蟒蛇身上刮下来_Web Scraping_Beautifulsoup_Pythonanywhere

Web scraping 从蟒蛇身上刮下来

web-scraping

Web scraping 从蟒蛇身上刮下来,web-scraping,beautifulsoup,pythonanywhere,Web Scraping,Beautifulsoup,Pythonanywhere,我在PythonAnywhere上有一个免费帐户，我正在那里尝试运行下面的脚本，该脚本在本地运行得很好我想知道我得到的错误是出于技术原因，还是仅仅是pythonany禁止人们从他们的平台上删除某些网站你知道有其他免费网站允许我放弃任何东西吗 import requests from bs4 import BeautifulSoup as bs def scrapMarketwatch(address): #creating formatting data from scrapdat

我在PythonAnywhere上有一个免费帐户，我正在那里尝试运行下面的脚本，该脚本在本地运行得很好

我想知道我得到的错误是出于技术原因，还是仅仅是pythonany禁止人们从他们的平台上删除某些网站

你知道有其他免费网站允许我放弃任何东西吗

import requests
from bs4 import BeautifulSoup as bs

def scrapMarketwatch(address):
    #creating formatting data from scrapdata
    r = requests.get(address)
    c = r.content
    sup = bs(c,"html.parser")
    print(sup)


scrapMarketwatch('http://www.marketwatch.com/investing/future/sp%20500%20futures')

print('\n\n\n PARAGRAPH \n SPACE \n\n\n')

scrapMarketwatch('https://www.bloomberg.com/quote/USDJPY:CUR')

我得到以下错误：

文件 /usr/local/lib/python3.6/dist-packages/requests/packages/urllib3/util/retry.py，第376行，增量引发MaxRetryError\u池、url、error或ResponseErrorcause requests.packages.urllib3.exceptions.MaxRetryError： HTTPSConnectionPoolhost='www.bloomberg.com'，port=443:最大重试次数超出url:/quote/USDJPY:CUR由ProxyError'引起，无法连接到代理“”，OSError“”隧道连接失败：403 在处理上述异常时，另一个发生异常：回溯最近的调用last:文件 /home/sylvester83/scrapit/try2.py，第20行，输入 scrapMarketwatch文件/home/sylvester83/scrapit/try2.py，第10行，在scrapMarketwatch中 r=requests.getaddress文件/usr/local/lib/python3.6/dist-packages/requests/api.py，第70行，在收到返回请求'get'，url，params=params，**kwargs文件/usr/local/lib/python3.6/dist-packages/requests/api.py，第56行，in 要求 return session.requestmethod=method，url=url，**kwargs文件/usr/local/lib/python3.6/dist-packages/requests/sessions.py，第行 488，应要求 resp=self.sendprep，**发送文件/usr/local/lib/python3.6/dist-packages/requests/sessions.py，第行 609，在发送中 r=adapter.sendrequest，**kwargs文件/usr/local/lib/python3.6/dist-packages/requests/adapters.py，第行 485，发送中 raise ProxyErrore，request=请求请求。异常。ProxyError: HTTPSConnectionPoolhost='www.bloomberg.com'，port=443:最大重试次数超出url:/quote/USDJPY:CUR由ProxyError'引起，无法连接到代理“”，OSEr ror“隧道连接失败：403 禁止",

Pythonywhere免费帐户只允许访问其上的外部站点。那些被允许的站点提供了一个机器API。你可以要求添加其他站点，但如果你打算删除它们，就不能这样做。

Pythony，免费帐户只允许访问其网站上的外部站点。那些被允许的站点提供了一个机器API。你可以要求添加其他网站，但如果你打算删除它们，就不能添加。

彭博社没有出现在他们的白名单上，所以这是一个编码问题？彭博社没有出现在他们的白名单上，所以这是一个编码问题？除此之外，你不能运行超过100秒的脚本，这不是真正有用的。除此之外，你不能运行一个脚本超过100秒，这不是很有帮助。