Python 美化组:打开本地和http html文件
我不能让两个都工作,只有一个或另一个:Python 美化组:打开本地和http html文件,python,beautifulsoup,Python,Beautifulsoup,我不能让两个都工作,只有一个或另一个: link = open(url) soup = BeautifulSoup(link.read(), "html.parser") ^使用本地文件 link = urlopen(url).read() soup = BeautifulSoup(link, "html.parser") ^使用http://(internet)链接 如何使这两个文件都工作?本地文件的路径是什么格式? 您只需检查输入字符串是否为URL: if url.startsw
link = open(url)
soup = BeautifulSoup(link.read(), "html.parser")
^使用本地文件
link = urlopen(url).read()
soup = BeautifulSoup(link, "html.parser")
^使用http://(internet)链接
如何使这两个文件都工作?本地文件的路径是什么格式? 您只需检查输入字符串是否为URL:
if url.startswith('http'):
link = urlopen(url).read()
else:
link = open(url)
否则,只需将本地文件的路径转换为,您应该能够像常规URL一样打开它们如果您在同一文件中使用所有四行,那么您将覆盖
链接
和汤
,以便仅存储链接中的HTML。你能公布你具体收到的错误吗?