Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/maven/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 日本字符搞砸了lxml解析_Python_Lxml - Fatal编程技术网

Python 日本字符搞砸了lxml解析

Python 日本字符搞砸了lxml解析,python,lxml,Python,Lxml,在lxml中我将如何执行以下操作 runtime_text = node.xpath("//dl/dt[text()=u'Runtime:' or text()=u'Laufzeit:' or text()=u'再生時間:']/following-sibling::dd")[0].text.strip() 如果没有汉字,它可以正常工作,但一旦添加该行,它就会出现以下故障: Traceback (most recent call last): File "<stdin>", li

在lxml中我将如何执行以下操作

runtime_text = node.xpath("//dl/dt[text()=u'Runtime:' or text()=u'Laufzeit:' or text()=u'再生時間:']/following-sibling::dd")[0].text.strip()
如果没有汉字,它可以正常工作,但一旦添加该行,它就会出现以下故障:

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "lxml.etree.pyx", line 1498, in lxml.etree._Element.xpath (src/lxml/lxml.etree.c:52102)
  File "xpath.pxi", line 295, in lxml.etree.XPathElementEvaluator.__call__ (src/lxml/lxml.etree.c:151816)
  File "apihelpers.pxi", line 1393, in lxml.etree._utf8 (src/lxml/lxml.etree.c:27087)
ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters
回溯(最近一次呼叫最后一次):
文件“”,第1行,在
lxml.etree.\u Element.xpath(src/lxml/lxml.etree.c:52102)中的文件“lxml.etree.pyx”,第1498行
文件“xpath.pxi”,第295行,位于lxml.etree.XPathElementEvaluator.调用(src/lxml/lxml.etree.c:151816)
文件“apihelpers.pxi”,第1393行,在lxml.etree.\u utf8(src/lxml/lxml.etree.c:27087)中
ValueError:所有字符串都必须与XML兼容:Unicode或ASCII,无空字节或控制字符
我想你想要:


runtime\u text=node.xpath(u//dl/dt[text()='runtime:'或text()='Laufzeit:'或text()='再生時間:']/以下同级::dd“[0]。text.strip()

lxml可能不理解python的unicode文本

我想您需要:


runtime\u text=node.xpath(u//dl/dt[text()='runtime:'或text()='Laufzeit:'或text()='再生時間:']/以下同级::dd“[0]。text.strip()

lxml可能不理解python的unicode文本

我想您需要:


runtime\u text=node.xpath(u//dl/dt[text()='runtime:'或text()='Laufzeit:'或text()='再生時間:']/以下同级::dd“[0]。text.strip()

lxml可能不理解python的unicode文本

我想您需要:


runtime\u text=node.xpath(u//dl/dt[text()='runtime:'或text()='Laufzeit:'或text()='再生時間:']/以下同级::dd“[0]。text.strip()


lxml可能不理解python的unicode文本再生時間:']/以下同级::dd“[0].text.strip()maybe?lxml可能不理解python的unicodeliterals@AnthonySottile:鉴于
lxml
是用C编写的……是的,可能:D@AnthonySottile谢谢你的提示--我将转换为答案
runtime\u text=node.xpath(u//dl/dt[text()='runtime:'或text())='Laufzeit:'或text()='再生時間:']/以下同级::dd“[0].text.strip()
maybe?lxml可能不理解python的unicodeliterals@AnthonySottile:鉴于
lxml
是用C编写的……是的,可能:D@AnthonySottile谢谢你的提示--我将转换为答案
runtime\u text=node.xpath(u//dl/dt[text()='runtime:'或text())='Laufzeit:'或text()='再生時間:']/以下同级::dd“[0].text.strip()
maybe?lxml可能不理解python的unicodeliterals@AnthonySottile:鉴于
lxml
是用C编写的……是的,可能:D@AnthonySottile谢谢你的提示--我将转换为答案
runtime\u text=node.xpath(u//dl/dt[text()='runtime:'或text())='Laufzeit:'或text()='再生時間:']/以下同级::dd“[0].text.strip()
maybe?lxml可能不理解python的unicodeliterals@AnthonySottile:鉴于
lxml
是用C编写的……是的,可能:D@AnthonySottile谢谢你的提示--我将转换为答案
xpath()
方法支持XPath语法的表达式。XPath语法与python分开。
XPath()
方法支持XPath语法的表达式。XPath语法与python分开。
XPath()
方法支持XPath语法的表达式。XPath语法与python分开。
XPath()
方法支持XPath语法的表达式。XPath语法与python是分开的。