Python 日本字符搞砸了lxml解析_Python_Lxml

Python 日本字符搞砸了lxml解析

python

Python 日本字符搞砸了lxml解析,python,lxml,Python,Lxml,在lxml中我将如何执行以下操作 runtime_text = node.xpath("//dl/dt[text()=u'Runtime:' or text()=u'Laufzeit:' or text()=u'再生時間：']/following-sibling::dd")[0].text.strip() 如果没有汉字，它可以正常工作，但一旦添加该行，它就会出现以下故障： Traceback (most recent call last): File "<stdin>", li

在lxml中我将如何执行以下操作

runtime_text = node.xpath("//dl/dt[text()=u'Runtime:' or text()=u'Laufzeit:' or text()=u'再生時間：']/following-sibling::dd")[0].text.strip()

如果没有汉字，它可以正常工作，但一旦添加该行，它就会出现以下故障：

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "lxml.etree.pyx", line 1498, in lxml.etree._Element.xpath (src/lxml/lxml.etree.c:52102)
  File "xpath.pxi", line 295, in lxml.etree.XPathElementEvaluator.__call__ (src/lxml/lxml.etree.c:151816)
  File "apihelpers.pxi", line 1393, in lxml.etree._utf8 (src/lxml/lxml.etree.c:27087)
ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters

回溯（最近一次呼叫最后一次）：
文件“”，第1行，在
lxml.etree.\u Element.xpath（src/lxml/lxml.etree.c:52102）中的文件“lxml.etree.pyx”，第1498行
文件“xpath.pxi”，第295行，位于lxml.etree.XPathElementEvaluator.调用（src/lxml/lxml.etree.c:151816）
文件“apihelpers.pxi”，第1393行，在lxml.etree.\u utf8（src/lxml/lxml.etree.c:27087）中
ValueError：所有字符串都必须与XML兼容：Unicode或ASCII，无空字节或控制字符

我想你想要：

runtime\u text=node.xpath（u//dl/dt[text（）='runtime:'或text（）='Laufzeit:'或text（）='再生時間：']/以下同级：：dd“[0]。text.strip（）

lxml可能不理解python的unicode文本

我想您需要：

runtime\u text=node.xpath（u//dl/dt[text（）='runtime:'或text（）='Laufzeit:'或text（）='再生時間：']/以下同级：：dd“[0]。text.strip（）

lxml可能不理解python的unicode文本

我想您需要：

runtime\u text=node.xpath（u//dl/dt[text（）='runtime:'或text（）='Laufzeit:'或text（）='再生時間：']/以下同级：：dd“[0]。text.strip（）

lxml可能不理解python的unicode文本

我想您需要：

runtime\u text=node.xpath（u//dl/dt[text（）='runtime:'或text（）='Laufzeit:'或text（）='再生時間：']/以下同级：：dd“[0]。text.strip（）

lxml可能不理解python的unicode文本再生時間：']/以下同级：：dd“[0].text.strip（）maybe？lxml可能不理解python的unicodeliterals@AnthonySottile：鉴于

lxml

是用C编写的……是的，可能：D@AnthonySottile谢谢你的提示--我将转换为答案

runtime\u text=node.xpath（u//dl/dt[text（）='runtime:'或text（））='Laufzeit:'或text（）='再生時間：']/以下同级：：dd“[0].text.strip（）

maybe？lxml可能不理解python的unicodeliterals@AnthonySottile：鉴于

lxml

是用C编写的……是的，可能：D@AnthonySottile谢谢你的提示--我将转换为答案

runtime\u text=node.xpath（u//dl/dt[text（）='runtime:'或text（））='Laufzeit:'或text（）='再生時間：']/以下同级：：dd“[0].text.strip（）

maybe？lxml可能不理解python的unicodeliterals@AnthonySottile：鉴于

lxml

是用C编写的……是的，可能：D@AnthonySottile谢谢你的提示--我将转换为答案

runtime\u text=node.xpath（u//dl/dt[text（）='runtime:'或text（））='Laufzeit:'或text（）='再生時間：']/以下同级：：dd“[0].text.strip（）

maybe？lxml可能不理解python的unicodeliterals@AnthonySottile：鉴于

lxml

是用C编写的……是的，可能：D@AnthonySottile谢谢你的提示--我将转换为答案

xpath（）

方法支持XPath语法的表达式。XPath语法与python分开。

XPath（）

方法支持XPath语法的表达式。XPath语法与python分开。

XPath（）

方法支持XPath语法的表达式。XPath语法与python分开。

XPath（）

方法支持XPath语法的表达式。XPath语法与python是分开的。