Web scraping 从蟒蛇身上刮下来
我在PythonAnywhere上有一个免费帐户,我正在那里尝试运行下面的脚本,该脚本在本地运行得很好 我想知道我得到的错误是出于技术原因,还是仅仅是pythonany禁止人们从他们的平台上删除某些网站 你知道有其他免费网站允许我放弃任何东西吗Web scraping 从蟒蛇身上刮下来,web-scraping,beautifulsoup,pythonanywhere,Web Scraping,Beautifulsoup,Pythonanywhere,我在PythonAnywhere上有一个免费帐户,我正在那里尝试运行下面的脚本,该脚本在本地运行得很好 我想知道我得到的错误是出于技术原因,还是仅仅是pythonany禁止人们从他们的平台上删除某些网站 你知道有其他免费网站允许我放弃任何东西吗 import requests from bs4 import BeautifulSoup as bs def scrapMarketwatch(address): #creating formatting data from scrapdat
import requests
from bs4 import BeautifulSoup as bs
def scrapMarketwatch(address):
#creating formatting data from scrapdata
r = requests.get(address)
c = r.content
sup = bs(c,"html.parser")
print(sup)
scrapMarketwatch('http://www.marketwatch.com/investing/future/sp%20500%20futures')
print('\n\n\n PARAGRAPH \n SPACE \n\n\n')
scrapMarketwatch('https://www.bloomberg.com/quote/USDJPY:CUR')
我得到以下错误:
文件
/usr/local/lib/python3.6/dist-packages/requests/packages/urllib3/util/retry.py,
第376行,增量
引发MaxRetryError\u池、url、error或ResponseErrorcause requests.packages.urllib3.exceptions.MaxRetryError:
HTTPSConnectionPoolhost='www.bloomberg.com',port=443:最大重试次数
超出url:/quote/USDJPY:CUR由ProxyError'引起,无法
连接到代理“”,OSError“”隧道连接失败:403
在处理上述异常时,另一个
发生异常:回溯最近的调用last:文件
/home/sylvester83/scrapit/try2.py,第20行,输入
scrapMarketwatch文件/home/sylvester83/scrapit/try2.py,第10行,在scrapMarketwatch中
r=requests.getaddress文件/usr/local/lib/python3.6/dist-packages/requests/api.py,第70行,在
收到
返回请求'get',url,params=params,**kwargs文件/usr/local/lib/python3.6/dist-packages/requests/api.py,第56行,in
要求
return session.requestmethod=method,url=url,**kwargs文件/usr/local/lib/python3.6/dist-packages/requests/sessions.py,第行
488,应要求
resp=self.sendprep,**发送文件/usr/local/lib/python3.6/dist-packages/requests/sessions.py,第行
609,在发送中
r=adapter.sendrequest,**kwargs文件/usr/local/lib/python3.6/dist-packages/requests/adapters.py,第行
485,发送中
raise ProxyErrore,request=请求请求。异常。ProxyError:
HTTPSConnectionPoolhost='www.bloomberg.com',port=443:最大重试次数
超出url:/quote/USDJPY:CUR由ProxyError'引起,无法
连接到代理“”,OSEr ror“隧道连接失败:403
禁止",
Pythonywhere免费帐户只允许访问其上的外部站点。那些被允许的站点提供了一个机器API。你可以要求添加其他站点,但如果你打算删除它们,就不能这样做。Pythony,免费帐户只允许访问其网站上的外部站点。那些被允许的站点提供了一个机器API。你可以要求添加其他网站,但如果你打算删除它们,就不能添加。彭博社没有出现在他们的白名单上,所以这是一个编码问题?彭博社没有出现在他们的白名单上,所以这是一个编码问题?除此之外,你不能运行超过100秒的脚本,这不是真正有用的。除此之外,你不能运行一个脚本超过100秒,这不是很有帮助。