在多个文本之间检索文本<;br>;在xml中使用python

在多个文本之间检索文本<;br>;在xml中使用python,python,xml,xml-parsing,elementtree,Python,Xml,Xml Parsing,Elementtree,你好 我有如下组成的xml文件,我想检索text1、text2、text3和text4 <?xml version="1.0" encoding="UTF-8"?> <TABLE> <MAIN> <CONTENU> text1 <br/> text2 <br/> text3 <br/> text4 </CONTENU> </MAIN> </TABLE> 我该怎么做?提前感

你好

我有如下组成的xml文件,我想检索text1、text2、text3和text4

<?xml version="1.0" encoding="UTF-8"?>
<TABLE>
<MAIN>
<CONTENU>
text1 <br/> text2  <br/> text3  <br/> text4
</CONTENU>
</MAIN>
</TABLE>

我该怎么做?提前感谢:)

尝试使用
tail
而不是
text
在关闭标签后获取内容:

将xml.etree.ElementTree作为ET导入
XML=”“”
text1
text2
text3
text4 """ root=ET.fromstring(XML) 对于root.iter('CONTENU')中的txt: 打印(txt.text) 对于txt.iter()中的c: 打印(c.tail)
输出:


文本1
文本2
文本3
文本4
另一种方法

from simplified_scrapy import SimplifiedDoc,utils,req
html = '''
<?xml version="1.0" encoding="UTF-8"?>
<TABLE>
<MAIN>
<CONTENU>
text1 <br/> text2  <br/> text3  <br/> text4
</CONTENU>
</MAIN>
</TABLE>
'''
doc = SimplifiedDoc(html)
texts = doc.select('CONTENU').getText(separator="|").split('|')
print (texts)
从simplified\u scrapy导入SimplifiedDoc、utils、req
html=“”
text1
text2
text3
text4 ''' doc=SimplifiedDoc(html) text=doc.select('CONTENU').getText(separator=“|”).split('|') 印刷品(文本)
尝试
tree.find(“MAIN/CONTENU”).itertext()
from simplified_scrapy import SimplifiedDoc,utils,req
html = '''
<?xml version="1.0" encoding="UTF-8"?>
<TABLE>
<MAIN>
<CONTENU>
text1 <br/> text2  <br/> text3  <br/> text4
</CONTENU>
</MAIN>
</TABLE>
'''
doc = SimplifiedDoc(html)
texts = doc.select('CONTENU').getText(separator="|").split('|')
print (texts)