Python 如何使用lxml库获取页面语言(xml:lang=";)?
我对lxml库非常陌生,现在解析除了链接以外的任何东西都很混乱 我阅读了文档,但我正在努力从顶部的Python 如何使用lxml库获取页面语言(xml:lang=";)?,python,python-2.7,lxml,Python,Python 2.7,Lxml,我对lxml库非常陌生,现在解析除了链接以外的任何东西都很混乱 我阅读了文档,但我正在努力从顶部的标记获取xml:lang=“…”属性的值 如何读取该值 示例:>>导入lxml.html >>>s=“”“ >>>root=lxml.html.fromstring >>>get('xml:lang') “en GB” 可能与我读过的内容重复。在发布此之前。坦白地说,我不相信它是复制品;撤回。HTML解析器允许您在不使用完整名称空间的情况下访问属性,我明白了。我正在尝试xpath。非常感谢。 >
标记获取xml:lang=“…”
属性的值
如何读取该值
示例:
>>导入lxml.html
>>>s=“”“
>>>root=lxml.html.fromstring
>>>get('xml:lang')
“en GB”
可能与我读过的内容重复。在发布此之前。坦白地说,我不相信它是复制品;撤回。HTML解析器允许您在不使用完整名称空间的情况下访问属性,我明白了。我正在尝试xpath。非常感谢。
>>> import lxml.html
>>> s = '''<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en-GB" lang="en"></html>'''
>>> root = lxml.html.fromstring(s)
>>> root.get('xml:lang')
'en-GB'