Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/xml/14.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python XML结束标记将文件弄乱_Python_Xml - Fatal编程技术网

Python XML结束标记将文件弄乱

Python XML结束标记将文件弄乱,python,xml,Python,Xml,基本上,我下载了一些XML文件,然后用元素树附加它们。问题是最终文件包含以下内容: <<?xml version="1.0" encoding="UTF-8" standalone="yes"?> - at the start of each new xml fil ... </product_info> /><product_info> ... 。。。 其中product info是

基本上,我下载了一些XML文件,然后用元素树附加它们。问题是最终文件包含以下内容:

<<?xml version="1.0" encoding="UTF-8" standalone="yes"?> - at the start of each new xml fil
...
</product_info> /><product_info> ...
。。。
其中product info是实际的余弦标签,/>是把一切搞砸的东西

我通过删除原始XML文件中的XML声明修复了第一部分:

replace('<?xml version="1.0" encoding="UTF-8" standalone="yes"?><','')
#I remove a closing bracet at the end because I cannot remove the opening bracet as it is not in the original file

replace(“如果您的文件不符合XML的要求,则它将不符合XML的要求,并且您通常不能使用设计用于在不符合XML定义的数据上解析XML的库

格式良好的故障示例包括:

  • 在XML声明之前有任何内容
  • 有多个根元素的
  • 未正确关闭元素
  • 组件名称中不允许使用字符。(例如,XML属性名称不能以
    开头。
    。)
您必须修复违反良好格式规则的代码,或手动编辑数据进行修复,或查看此Q/A了解其他选项:


如果您的原始文件包含该内容,那么它们一开始就不是真正的XML。如果输入文件是真正的XML,而输出文件不是,那么我们需要看到一个具有尽可能短的代码(和示例输入文档)的文档,它正好说明了如何修复它。
<Element 'product_info article_id="0006303562403"...'