Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/xml/12.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python中文件的XML美化_Python_Xml_Prettify - Fatal编程技术网

Python中文件的XML美化

Python中文件的XML美化,python,xml,prettify,Python,Xml,Prettify,我有一个xml文件,看起来像下面的示例 许多文本包含空格作为起始字符,或在开头有\n(换行符),或其他疯狂的东西。我正在使用xml.etree.ElementTree,从这个文件进行解析很好 但我想要更多!:)我试图美化这一团糟,但没有成功。尝试了很多教程,但最后总是没有漂亮的XML 带空格的名称 每日电讯报 72/2015 10 2015-03-26 托马斯优先 经济 我的文本在这里 如何解析 网络文章 72/2015 1. 2015-03-26 某作者 描述 我的文本在这里 当我尝试从中

我有一个xml文件,看起来像下面的示例

许多文本包含空格作为起始字符,或在开头有
\n
(换行符),或其他疯狂的东西。我正在使用
xml.etree.ElementTree
,从这个文件进行解析很好

但我想要更多!:)我试图美化这一团糟,但没有成功。尝试了很多教程,但最后总是没有漂亮的XML


带空格的名称
每日电讯报
72/2015
10
2015-03-26
托马斯优先
经济
我的文本在这里
如何解析
网络文章
72/2015
1.
2015-03-26
某作者
描述
我的文本在这里
当我尝试从中获取另一个答案时,它会生成相同的文件或更混乱的XML

from bs4 import BeautifulSoup

doc = BeautifulSoup(xmlstring, 'xml')

print doc.prettify()

顺便说一句,新行的可能重复是导致答案生成混乱XML的主要原因。如果数据中不需要换行符,只需使用类似于
tr-d
(尽管跳过第一行——这很容易做到),那么几乎任何XML处理器在被告知进行漂亮打印时都会做正确的事情。@LukasGraf如果你看一下可能的重复,它们会解决不同的问题。我的意思是这不是复制品,谢谢。这对我有帮助。我将重写代码以反映新的漂亮XML:)这是我编写的python脚本。愿它对某人有用。它解析斯洛伐克语术语。非常感谢。