在多个文本之间检索文本<;br>;在xml中使用python
你好 我有如下组成的xml文件,我想检索text1、text2、text3和text4在多个文本之间检索文本<;br>;在xml中使用python,python,xml,xml-parsing,elementtree,Python,Xml,Xml Parsing,Elementtree,你好 我有如下组成的xml文件,我想检索text1、text2、text3和text4 <?xml version="1.0" encoding="UTF-8"?> <TABLE> <MAIN> <CONTENU> text1 <br/> text2 <br/> text3 <br/> text4 </CONTENU> </MAIN> </TABLE> 我该怎么做?提前感
<?xml version="1.0" encoding="UTF-8"?>
<TABLE>
<MAIN>
<CONTENU>
text1 <br/> text2 <br/> text3 <br/> text4
</CONTENU>
</MAIN>
</TABLE>
我该怎么做?提前感谢:)尝试使用
tail
而不是text
在关闭标签后获取内容:
将xml.etree.ElementTree作为ET导入
XML=”“”
text1
text2
text3
text4
"""
root=ET.fromstring(XML)
对于root.iter('CONTENU')中的txt:
打印(txt.text)
对于txt.iter()中的c:
打印(c.tail)
输出:
文本1
文本2
文本3
文本4
另一种方法
from simplified_scrapy import SimplifiedDoc,utils,req
html = '''
<?xml version="1.0" encoding="UTF-8"?>
<TABLE>
<MAIN>
<CONTENU>
text1 <br/> text2 <br/> text3 <br/> text4
</CONTENU>
</MAIN>
</TABLE>
'''
doc = SimplifiedDoc(html)
texts = doc.select('CONTENU').getText(separator="|").split('|')
print (texts)
从simplified\u scrapy导入SimplifiedDoc、utils、req
html=“”
text1
text2
text3
text4
'''
doc=SimplifiedDoc(html)
text=doc.select('CONTENU').getText(separator=“|”).split('|')
印刷品(文本)
尝试tree.find(“MAIN/CONTENU”).itertext()
。
from simplified_scrapy import SimplifiedDoc,utils,req
html = '''
<?xml version="1.0" encoding="UTF-8"?>
<TABLE>
<MAIN>
<CONTENU>
text1 <br/> text2 <br/> text3 <br/> text4
</CONTENU>
</MAIN>
</TABLE>
'''
doc = SimplifiedDoc(html)
texts = doc.select('CONTENU').getText(separator="|").split('|')
print (texts)