Web scraping 从蟒蛇身上刮下来

Web scraping 从蟒蛇身上刮下来,web-scraping,beautifulsoup,pythonanywhere,Web Scraping,Beautifulsoup,Pythonanywhere,我在PythonAnywhere上有一个免费帐户,我正在那里尝试运行下面的脚本,该脚本在本地运行得很好 我想知道我得到的错误是出于技术原因,还是仅仅是pythonany禁止人们从他们的平台上删除某些网站 你知道有其他免费网站允许我放弃任何东西吗 import requests from bs4 import BeautifulSoup as bs def scrapMarketwatch(address): #creating formatting data from scrapdat

我在PythonAnywhere上有一个免费帐户,我正在那里尝试运行下面的脚本,该脚本在本地运行得很好

我想知道我得到的错误是出于技术原因,还是仅仅是pythonany禁止人们从他们的平台上删除某些网站

你知道有其他免费网站允许我放弃任何东西吗

import requests
from bs4 import BeautifulSoup as bs

def scrapMarketwatch(address):
    #creating formatting data from scrapdata
    r = requests.get(address)
    c = r.content
    sup = bs(c,"html.parser")
    print(sup)


scrapMarketwatch('http://www.marketwatch.com/investing/future/sp%20500%20futures')

print('\n\n\n PARAGRAPH \n SPACE \n\n\n')

scrapMarketwatch('https://www.bloomberg.com/quote/USDJPY:CUR')
我得到以下错误:

文件 /usr/local/lib/python3.6/dist-packages/requests/packages/urllib3/util/retry.py, 第376行,增量 引发MaxRetryError\u池、url、error或ResponseErrorcause requests.packages.urllib3.exceptions.MaxRetryError: HTTPSConnectionPoolhost='www.bloomberg.com',port=443:最大重试次数 超出url:/quote/USDJPY:CUR由ProxyError'引起,无法 连接到代理“”,OSError“”隧道连接失败:403 在处理上述异常时,另一个 发生异常:回溯最近的调用last:文件 /home/sylvester83/scrapit/try2.py,第20行,输入 scrapMarketwatch文件/home/sylvester83/scrapit/try2.py,第10行,在scrapMarketwatch中 r=requests.getaddress文件/usr/local/lib/python3.6/dist-packages/requests/api.py,第70行,在 收到 返回请求'get',url,params=params,**kwargs文件/usr/local/lib/python3.6/dist-packages/requests/api.py,第56行,in 要求 return session.requestmethod=method,url=url,**kwargs文件/usr/local/lib/python3.6/dist-packages/requests/sessions.py,第行 488,应要求 resp=self.sendprep,**发送文件/usr/local/lib/python3.6/dist-packages/requests/sessions.py,第行 609,在发送中 r=adapter.sendrequest,**kwargs文件/usr/local/lib/python3.6/dist-packages/requests/adapters.py,第行 485,发送中 raise ProxyErrore,request=请求请求。异常。ProxyError: HTTPSConnectionPoolhost='www.bloomberg.com',port=443:最大重试次数 超出url:/quote/USDJPY:CUR由ProxyError'引起,无法 连接到代理“”,OSEr ror“隧道连接失败:403 禁止",


Pythonywhere免费帐户只允许访问其上的外部站点。那些被允许的站点提供了一个机器API。你可以要求添加其他站点,但如果你打算删除它们,就不能这样做。

Pythony,免费帐户只允许访问其网站上的外部站点。那些被允许的站点提供了一个机器API。你可以要求添加其他网站,但如果你打算删除它们,就不能添加。

彭博社没有出现在他们的白名单上,所以这是一个编码问题?彭博社没有出现在他们的白名单上,所以这是一个编码问题?除此之外,你不能运行超过100秒的脚本,这不是真正有用的。除此之外,你不能运行一个脚本超过100秒,这不是很有帮助。