Python html5lib返回值<;无>;

Python html5lib返回值<;无>;,python,html5lib,Python,Html5lib,在html5lib教程的第一步中,我看到了相当混乱的行为 报告指出: 这将返回一个自定义“simpletree”格式的树 作为文件,我有一个普通的html文档。但就我而言,这是: <None> >>> doc is None False 在doc=html5lib.parse(f)之后,f.read()返回空字符串,就像文件已经读取的文件一样。 并不意味着文档没有被解析,它只是意味着文档没有名称。如果你这样做 doc.name = "test" print(doc

html5lib
教程的第一步中,我看到了相当混乱的行为

报告指出:

这将返回一个自定义“simpletree”格式的树

作为文件,我有一个普通的html文档。但就我而言,这是:

<None>
>>> doc is None
False
doc=html5lib.parse(f)
之后,
f.read()
返回空字符串,就像文件已经读取的文件一样。

  • 并不意味着文档没有被解析,它只是意味着文档没有名称。如果你这样做

    doc.name = "test"
    print(doc)
    
    它应该显示

  • parse
    还可以将字符串作为参数,在这种情况下,它将为您加载文件,无需自己打开

  • 尝试打印(doc.toxml())


  • 当然,这是从redmine=)的登录页面复制的html文件,我使用完整路径,如
    /home/user/file.html
    f = open("mydocument.html")
    f.read()
    # returns string with html
    
    doc.name = "test"
    print(doc)