Python 如何处理html文件上的内存错误?
我有这种代码Python 如何处理html文件上的内存错误?,python,html,beautifulsoup,Python,Html,Beautifulsoup,我有这种代码 URL = r"C:\Users\jarze\PycharmProjects\CSV-modifier\venv\html.html" html_report_part1 = open(URL, 'r', encoding="UTF-8").read() soup = BeautifulSoup(html_report_part1, "html.parser") 并且它返回这种错误: 在处理上述异常期间,发生了另一个异常
URL = r"C:\Users\jarze\PycharmProjects\CSV-modifier\venv\html.html"
html_report_part1 = open(URL, 'r', encoding="UTF-8").read()
soup = BeautifulSoup(html_report_part1, "html.parser")
并且它返回这种错误:
在处理上述异常期间,发生了另一个异常:
记忆者
尝试:
MemoryError:文件大吗?试着逐行阅读?请添加füll stacktrace。最初的错误是什么?html文件大吗?文件中可能存在html攻击。它小到可以检查吗?它会显示在浏览器中吗?文件实际上相当大。它的重量约为200mbHey,您的代码似乎正在运行,但距离我开始执行它的时间还有4个小时,它仍在进行中:(
URL = r"C:\Users\jarze\PycharmProjects\CSV-modifier\venv\html.html"
html_report_part1 = open(URL, 'r', encoding="UTF-8")
html_text = ''
for line in html_report_part1.readlines():
html_text += line
soup = BeautifulSoup(html_text, "html.parser")