Python html5lib返回值<;无>;
在Python html5lib返回值<;无>;,python,html5lib,Python,Html5lib,在html5lib教程的第一步中,我看到了相当混乱的行为 报告指出: 这将返回一个自定义“simpletree”格式的树 作为文件,我有一个普通的html文档。但就我而言,这是: <None> >>> doc is None False 在doc=html5lib.parse(f)之后,f.read()返回空字符串,就像文件已经读取的文件一样。 并不意味着文档没有被解析,它只是意味着文档没有名称。如果你这样做 doc.name = "test" print(doc
html5lib
教程的第一步中,我看到了相当混乱的行为
报告指出:
这将返回一个自定义“simpletree”格式的树
作为文件,我有一个普通的html文档。但就我而言,这是:
<None>
>>> doc is None
False
在doc=html5lib.parse(f)
之后,f.read()
返回空字符串,就像文件已经读取的文件一样。
并不意味着文档没有被解析,它只是意味着文档没有名称。如果你这样做
它应该显示doc.name = "test" print(doc)
还可以将字符串作为参数,在这种情况下,它将为您加载文件,无需自己打开parse
- 尝试打印(doc.toxml())
当然,这是从redmine=)的登录页面复制的html文件,我使用完整路径,如
/home/user/file.html
f = open("mydocument.html")
f.read()
# returns string with html
doc.name = "test"
print(doc)