Python 使用ElementTree解析带有特殊字符的XML_Python_Xml_Elementtree - Fatal编程技术网

Python 使用ElementTree解析带有特殊字符的XML

python xml

Python 使用ElementTree解析带有特殊字符的XML,python,xml,elementtree,Python,Xml,Elementtree,我尝试使用ElementTree解析的GET服务包含一个非UTF8特殊字符，我不控制该服务的内容： respXML = response.content.decode("utf-8") respRoot = ET.fromstring(respXML) 第二行抛出 xml.etree.ElementTree.ParseError:对无效字符号的引用：第3591行第39列我如何确保不管字符集是什么，都能解析XML，如果我发现非法字符，我可以在以后运行替换？例如，是否存在包含所有内容的编码？我

我尝试使用

ElementTree

解析的GET服务包含一个非UTF8特殊字符，我不控制该服务的内容：

respXML = response.content.decode("utf-8")

respRoot = ET.fromstring(respXML)

第二行抛出

xml.etree.ElementTree.ParseError:对无效字符号的引用：第3591行第39列

我如何确保不管字符集是什么，都能解析XML，如果我发现非法字符，我可以在以后运行替换？例如，是否存在包含所有内容的编码？我知道我可以搜索和替换输入XML字符串，但我更愿意首先解析它，因为我的解析将其转换为更易于搜索的数据结构

所讨论的特殊字符是

但我希望能够摄取任何角色。整个标签是Alzheimer；s disease
在@tdelaney的帮助下，我通过将输入XML作为字符串擦洗，克服了这个障碍：
respXML = response.content.decode("utf-8")

scrubbedXML = re.sub('&.+[0-9]+;', '', respXML)

respRoot = ET.fromstring(scrubbedXML)

第3591行是什么？我刚刚编辑了问题，看到最后一句了吗？不是编码。。。它是和#25unicode实体引用这就是问题所在。我不知道如何将外部实体添加到ElementTree中
（其中d是十进制数字）解码为unicode，该字符表示“媒体结尾”字符，该字符不是有效的xml。我唯一能想到的就是用替换它在将其传递给ET之前。这是插入之前进行清理的一个很好的参数！这可能是某种编码不匹配，例如mbcs被发布到假定的utf-8条目。




[xml]相关文章推荐



                                                        
在subversion中管理XML文档忽略格式设置
xmlsvnformatting 
为什么XML:：LibXML在使用命名空间时找不到此xpath查询的节点
xmlperlxpath 
用XML构建动态网站
xmlxquery 
Xml XSLT-对的副本的使用似乎忽略了；如果；模板中的状态
xmlxslt 
RTSP流式xml或文本文件
xmlstreaming 
如何将新闻XML结果传递到另一页
xmlsilverlightlinqwindows-phone-7 
无法放置href链接以使用xslt文件在xml中展开结果
xmlxslt 
XML文档到MATLAB的转换
xmlmatlab 
Xml Curl异常HTTP 415:JAX-RS和Jersey中不支持的媒体类型异常
xmljersey 
Boost XML解析器可以支持<；！[CDATA[…；]>；？
xmlboost 
Xml 使用xsl：分析字符串并保留标记（如在标识转换中）
xmlxslt 
Perl XML:：LibXML用法
xmlperlloops 
angularJS spring项目中XML注入的预防
xmlsecurity 
如何在xml中包含xml文件&书信电报；席：不包括在内
xml 
XML中的名称空间和前缀有什么区别？
xml 
在Python中输出os.system，并使用它在xml文件中创建文本节点
xmllinuxpython-3.xbashdocker 
XSL-如何在另一个循环中为每个循环下一步，以链接来自不同xml节点的相同值
xmlxslt 
Xml 从post请求在磁盘上快速保存文件（gzip）
xmlfileexpresshttp 
用VB.Net读取XML
这是示例XML代码。
世界
开始
0.01
gh/ho/frTrig\U o
0.02
gh/ho/frTrig\U O
世界
开始
0.03
gh/ho/frTrig_oZ
0.04
gh/ho/frTrig\U oX
xmlvb.net 
使用powershell避免从xml文件中删除空行
基本上问题是原始XML文件（ $MyFielPase）在文件中有空行，但是在保存XML文件时，空行被删除。
xmlpowershell 
                                       





随机文章推荐



                                                        
Yii2 在附加到ActiveRecord的行为中使用save（）
yii2 
Yii2 在yii中创建和更新时设置默认值
yii2 
Yii2 ActiveDataProvider find（）->；全部（）
yii2 
用户从前端注册后，YII2重定向到后端
yii2 
Yii2参数访问公共目录中的本地配置文件
yii2 
Yii2 活动视图中按钮的可见性
yii2 
Yii2 PHP-Yii 2.0多个图像保存在文件夹中，但未保存在数据库中
yii2 
Yii2在任何用户创建或更新后向管理员发送消息（或通知）
yii2 
yii2不使用主键更新表
yii2 
如何在yii2中发送带有try-catch异常的参数？
yii2 
Yii2 Yi2 mpdf呈现html已达到最大内存大小
yii2 
如何在Yii2中获取dropDownList的值？
yii2 
Yii2将数字转换为单词
yii2 
Yii2 Basic在创建内容时上载多个图像
yii2 
Yii2，如何在rest请求中使用or运算符
yii2 
Yii2所有模型中的通用行为
yii2 
Yii2获取正确的客户端IP
yii2 
Yii2 如何设置swiftmailer模板的路径
yii2 
我使用Yii2，需要连接ckedit5，但上传照片时出现错误-400（请求错误）
yii2 
Yii2 API Rest查询参数或条件
yii2


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python 如何使用distribute打包示例脚本？
									Python
							 
避免使用if uuu name uuuu==&x27__主&'；在Python子类中，使用父函数运行
									Python
							 
运行Heroku'时出现问题；使用Python的Facebook应用程序教程
									Python
							 									Facebook
							 									Heroku
							 									Flask
							 
Python '；轴'；scipy.ndimage.interpolation.rotate中的参数
									Python
							 									Numpy
							 
Python 此玩具环境中的最佳多处理方法
									Python
							 									Performance
							 									Parallel Processing
							 
Python null=True的OneToOneField不'；不允许空字段
									Python
							 									Sql
							 									Django
							 									Django Models
							 
将幂律拟合到Python中的经验数据
									Python
							 
python导入pika时没有模块名pika
									Python
							 
Python 提高Django管理列表筛选器查询的性能
									Python
							 									Django
							 
Python 如何将具有相同值的numpy数组的元素分组到不同的numpy数组中
									Python
							 									Numpy
							 
在python中，我们可以在（其他）用户代码执行之前跟踪模块级分配吗？
									Python
							 
Python Scrapy解析javascript
									Python
							 									Regex
							 									Web Scraping
							 									Scrapy
							 									Web Crawler
							 
Python 用pymodbus读取寄存器
									Python
							 
Python 由于延迟加载，DatabaseSessionSover与小马ORM冲突？
									Python
							 									Orm
							 
Python 使用pyKML解析KML文档
									Python
							 									Xml
							 
如何安装适用于Python 3.4的OpenCV？
									Python
							 									Opencv
							 
PythonConnect 4 check win函数
									Python
							 
如何将命令提示符中的Python编码保存为文件？
									Python
							 									File
							 
Python-在提取数据之前对JSON元素进行计数
									Python
							 									Json
							 
Python 重新采样dataframe正在删除列
									Python
							 									Pandas
							 
出口C&x2B+；使用ctypes:undefined symbol将函数转换为python
									Python
							 									C++
							 
python中是否有一种模式，在出现异常时，python只打印异常消息并执行下一行？
									Python
							 									Exception
							 
Python Gevent，Flask应用程序在流式传输视频时卡住，直到客户端断开连接
									Python
							 									Flask
							 
Python scrapy返回0个结果
									Python
							 									Scrapy
							 
Python多处理加速
									Python
							 									Python 2.7
							 
Python 数据聚合和对齐
									Python
							 									Pandas
							 									Datetime
							 
从bash重复运行Python脚本
									Python
							 									Linux
							 
在Python中的字典列表中使用for循环时出现类型错误
									Python
							 									Json
							 									List
							 									Parsing
							 									Dictionary
							 
如何在python中将lxml.etree.\u XSLTResultTree转换为元组？
									Python
							 
Python 使用selenium时Chrome启动更多驱动程序错误
									Python
							 									Selenium
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Push Notification
Installation
Version Control
Orchardcms
Phpmyadmin
Ms Access
Cluster Computing
Titanium
Amazon Dynamodb
Dependencies
Emacs
Hibernate
Windows Services
If Statement
Jersey
Paypal
Openssl
Visual Studio
Jasmine
Arm
Compression
Image
Cocos2d X
Netty
Matrix
Transactions
Stored Procedures
Parameters
Network Programming
Docusignapi
Google Maps Api 3
Web Applications
Sapui5
Dojo
Html5 Canvas
Google Compute Engine
Wpf
Weblogic
Robotframework
Maps
Formatting
Python 3.x
Embedded
Drop Down Menu
Browser
Visual Studio 2017
Sharepoint
Jquery
Woocommerce
Process
Racket
Chef Infra
Coffeescript
Angular6
Api
Mono
Winapi
Functional Programming
Report
Uwp
Web
Dictionary
Gulp
Aframe
Git
Db2
Webgl
Msbuild
Data Binding
Utf 8
Opencart
Search
Jsp
Object
Gitlab
Glsl
Charts
Sqlite
Protractor
Hybris
Phpstorm
Ssl
Pointers
Directory
Parallel Processing
Sonarqube
Audio
Xsd
Binary
Cakephp
Listview
Ruby On Rails 3.2
Laravel
Tkinter
Gatsby
Sas
Hyperlink
Asp.net
String
Lisp
Wcf
Safari
Dependency Injection
Internet Explorer
Time Complexity
Seo
Android Ndk
Asp.net Core
Datatables
Fullcalendar
Blackberry
Angular
Visual Studio 2008
Microsoft Graph Api
Unix
Pentaho
Ios
Amazon S3
Csv
Ecmascript 6
Jsf 2
System Verilog
Com
Exception Handling
Pip
Office Js
Javascript
Cmd
Netbeans
Jsf
Django
Iphone
Graph
Jwt
Erlang
Azure Data Factory
Optimization
Umbraco
Powershell
Events
Shell
Url
Tree
Ruby On Rails 3.1
Download
Cloud
Postgresql
Rspec
Twitter Bootstrap
Spring Cloud
Open Source
Biztalk
Checkbox
Google Plus
EmptyTag
Makefile
Composer Php
Rabbitmq
Nosql
Calendar
Google Colaboratory
Uml
Entity Framework Core
Spring Security
Bots
Ada
Sql
Extjs
Blazor
Authentication
Logstash
Kernel
Polymer
Nestjs
Mariadb
C#
Methods
Reference
Mdx
Processing
Amazon Web Services
Replace
Instagram
Prolog
Plugins
Asp.net Mvc 5
Nsis
Xslt
Go
Apache Kafka
Eclipse Rcp
Uitableview
Itext
Hbase
Arrays
.net
Pycharm
Yaml
Session
Ms Word
Ide


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网