在多个文本之间检索文本<；br>；在xml中使用python_Python_Xml_Xml Parsing_Elementtree

在多个文本之间检索文本<；br>；在xml中使用python

python xml

在多个文本之间检索文本<；br>；在xml中使用python,python,xml,xml-parsing,elementtree,Python,Xml,Xml Parsing,Elementtree,你好我有如下组成的xml文件，我想检索text1、text2、text3和text4 <?xml version="1.0" encoding="UTF-8"?> <TABLE> <MAIN> <CONTENU> text1 <br/> text2 <br/> text3 <br/> text4 </CONTENU> </MAIN> </TABLE> 我该怎么做？提前感

你好

我有如下组成的xml文件，我想检索text1、text2、text3和text4

<?xml version="1.0" encoding="UTF-8"?>
<TABLE>
<MAIN>
<CONTENU>
text1 <br/> text2  <br/> text3  <br/> text4
</CONTENU>
</MAIN>
</TABLE>

我该怎么做？提前感谢：）

尝试使用

tail

而不是

text

在关闭标签后获取内容：

将xml.etree.ElementTree作为ET导入
XML=”“”
text1
text2
text3
text4
"""
root=ET.fromstring（XML）
对于root.iter（'CONTENU'）中的txt：
打印（txt.text）
对于txt.iter（）中的c：
打印（c.tail）

输出：


文本1
文本2
文本3
文本4

另一种方法

from simplified_scrapy import SimplifiedDoc,utils,req
html = '''
<?xml version="1.0" encoding="UTF-8"?>
<TABLE>
<MAIN>
<CONTENU>
text1 <br/> text2  <br/> text3  <br/> text4
</CONTENU>
</MAIN>
</TABLE>
'''
doc = SimplifiedDoc(html)
texts = doc.select('CONTENU').getText(separator="|").split('|')
print (texts)

从simplified\u scrapy导入SimplifiedDoc、utils、req
html=“”
text1
text2
text3
text4
'''
doc=SimplifiedDoc（html）
text=doc.select（'CONTENU'）.getText（separator=“|”）.split（'|'）
印刷品（文本）

尝试

tree.find（“MAIN/CONTENU”）.itertext（）

。

from simplified_scrapy import SimplifiedDoc,utils,req
html = '''
<?xml version="1.0" encoding="UTF-8"?>
<TABLE>
<MAIN>
<CONTENU>
text1 <br/> text2  <br/> text3  <br/> text4
</CONTENU>
</MAIN>
</TABLE>
'''
doc = SimplifiedDoc(html)
texts = doc.select('CONTENU').getText(separator="|").split('|')
print (texts)