Python LXML：获取子元素之间的文本_Python_Html_Lxml - Fatal编程技术网

Python LXML：获取子元素之间的文本

python html

Python LXML：获取子元素之间的文本,python,html,lxml,Python,Html,Lxml,我有一个结构糟糕的html模板，其中我的元素包含多个元素（p、figure、a等），但中间还有原始文本。如何访问所有这些文本片段，并在适当的位置编辑它们（我需要的是用标记替换所有$$code$$） section.text和section.tail都返回空字符串…检查紧靠文本前面的完整标记的.tail。因此，在ABCDE中，两个元素的尾部将包含C和E 例如： from lxml import etree root = etree.fromstring('<root><sect

我有一个结构糟糕的html模板，其中我的

元素包含多个元素（p、figure、a等），但中间还有原始文本。如何访问所有这些文本片段，并在适当的位置编辑它们（我需要的是用标记替换所有

$$code$$

）

section.text

和

section.tail

都返回空字符串…

检查紧靠文本前面的完整标记的

.tail

。因此，在

AB
CD
E

中，两个

元素的

尾部将包含C和E
例如：
from lxml import etree

root = etree.fromstring('<root><section>A<p>B</p>C<p>D</p>E</section></root>')

for section_child in root.find('section'):
    section_child.tail = section_child.tail.lower()

print(etree.tounicode(root))

从lxml导入etree
root=etree.fromstring（'AB
CDE'））
对于root.find（'section'）中的第_子节：
section\u child.tail=section\u child.tail.lower（）
打印（etree.tounicode（根））

结果:
AB
cDe
我从我发布的问题的答案中学到：
从lxml导入etree
xml='aaaa1bbbaaa2cccaaaa3'
element=etree.fromstring（xml）
对于element.xpath（'text（）'）中的文本：
xml=xml.replace（f'>{text}{text.upper（）}
from lxml import etree


xml = '<a>aaaa1<b>bbbb</b>aaaa2<c>cccc</c>aaaa3</a>'
element = etree.fromstring(xml)
for text in element.xpath('text()'):
    xml = xml.replace(f'>{text}<', f'>{text.upper()}<')




[html]相关文章推荐



                                                        
Html 如何在Firefox和IE8中获得相同高度的H1内容？
htmlcss 
Html 将文件扩展名添加到"；href"；价值
html 
Html 在触摸式移动设备上激活无线电标签
html 
Html li和span的样式设置有问题-边距/填充/定位
htmlcss 
Html 在CSS中，什么是点某物后跟没有点的某物
htmlcss 
Html 如何实现子菜单效果？
htmlcss 
Html 对齐联系人表格7中的输入框
htmlcsswordpress 
Html OSclass中的粘性页脚
htmlcss 
Html 如何在字幕幻灯片放映中在每张图像下方书写文字
htmlcss 
Html 如何保持连接Web套接字？
htmlwebsocket 
Html div元素的高度与父元素不匹配'；100%时的s高度
htmlcsstwitter-bootstraptwitter-bootstrap-3 
Html IE 9背景图像位置属性
htmlcssinternet-explorer 
Html 选择“我的asp:DropDownList”时向下滑动，而不是上下滑动
htmlasp.net 
Html 将文本改为“；图x“；内段加粗
htmlcss 
Html Asp.Net应用程序不正确支持非Ascii字符
htmlasp.net 
Html 取决于上一个查询的多级答案
htmlrandom 
Html 在\u组中\u不显示为行
htmlcss 
Html flexbox容器中的项目订单
htmlcss 
Html 在3列表格的前2列中居中？
html 
Html 多行占位符文本在iOS Safari中创建缩进
htmlioscsssafari 
                                       





随机文章推荐



                                                        
带有SyslogAppender的Log4net，1kb消息限制
log4net 
log4net是否有SNMP附加器？
log4netsnmp 
log4net中的根记录器是什么
log4net 
使用log4net创建可以使用SvcTraceViewer.exe查看的日志文件
log4net 
Log4Net未创建日志文件
log4net 
log4net无法将数据插入自定义列
log4net 
Log4net记录器中的附加器列表为空
log4net


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
从Python列表到numpy数组，同时保留类型
									Python
							 									Numpy
							 
Python virtualenv pip can'；不要安装软件包
									Python
							 									Pip
							 
如何在Python3.6中从字节（1D）数组转换为RGB数组（2D）？（裸体还是肌肉？）
									Python
							 									Numpy
							 
Python Mongo connector没有从MongoDB集合导入所有字段，只是导入了id字段
									Python
							 									Mongodb
							 									Solr
							 
Python 来自pcap文件（django）的时间戳值
									Python
							 									Django
							 									Python 3.x
							 
Python 在groovysh中启用intellisense
									Python
							 									Groovy
							 									Command Line
							 
Python-CSV模块，跳过行
									Python
							 									Csv
							 
Python 基于特定条件根据另一个数据帧更新数据帧
									Python
							 									Pandas
							 									Dataframe
							 
Python&；tkinter->；上传长二进制数并滚动x滚动条冻结程序时显示错误
									Python
							 									Tkinter
							 
Python 如何使用最终预测在TensorFlow之外复制TensorFlow损失值？
									Python
							 									R
							 									Machine Learning
							 									Tensorflow
							 
Python 等高线图问题
									Python
							 
Python 异步、非阻塞地处理来自高速公路订阅的消息
									Python
							 									Docker
							 
Python Django以字符串形式获取当前视图的名称
									Python
							 									Django
							 									View
							 
Python Can'；t Pickle线程锁对象
									Python
							 									Apache Spark
							 									Logging
							 									Pyspark
							 
Python Jinja2模板使用字符串呈现
									Python
							 									Templates
							 
Python Tensorflow:Array activation1是Div操作符的输入，用于生成输出数组dropout/Div，它缺少min/max数据
									Python
							 									Tensorflow
							 
相当于Python C API中的_all _
									Python
							 
Python 如何使用cython包装将函数作为参数的函数？
									Python
							 
Python 在实数数组中查找最近元素的最快方法
									Python
							 									Search
							 									Tree
							 
Python套接字编程-ConnectionRefusedError:[WinError 10061]无法建立连接，因为目标计算机主动拒绝了它
									Python
							 									Sockets
							 
python（boto3）程序通过描述删除aws中的旧快照
									Python
							 									Amazon Web Services
							 									Aws Lambda
							 
Python 如何将子项与数据框架中的父项关联？
									Python
							 									Numpy
							 									Dataframe
							 
在MacOS for Python3.7中安装psycopg2时出现问题
									Python
							 									Python 3.x
							 									Pip
							 
Python 使用cv2时删除[h264@xxx]错误cosole输出
									Python
							 									Python 3.x
							 									Opencv
							 
Python 如何使用PyTorch训练原始的U-Net模型？
									Python
							 									Pytorch
							 
Python pyspark 2.2.1：如何用空列表填充列的空值
									Python
							 									Pyspark
							 
Python 如何使用虚线图删除下拉列表并使其变为静态
									Python
							 									Pandas
							 
Python 就大O而言，此解决方案的运行时复杂性和空间复杂性是多少？
									Python
							 									Big O
							 
Python 深度Q网络中的目标值训练
									Python
							 									Deep Learning
							 
Python 仅生产中的AUTH_USER_模型错误：AUTH_USER_模型指模型'；授权用户'；还没有安装
									Python
							 									Django
							 									Heroku
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Xcode4
Sphinx
Date
Android Fragments
Llvm
Automation
Fonts
Scroll
Terminal
Webgl
Common Lisp
Jestjs
Google Analytics
Macros
Sed
Azure Cosmosdb
EmptyTag
Firefox
Error Handling
Objective C
Ide
Atom Editor
Makefile
Scikit Learn
Rspec
Material Ui
Process
Smalltalk
Vb6
Google Cloud Platform
Identityserver4
Couchdb
E Commerce
Installation
Couchbase
Google Visualization
Git
Sails.js
Ruby On Rails 3
Kernel
Swiftui
Puppet
Sdk
Prestashop
Facebook
Xslt
Sparql
Google Cloud Dataflow
Web Scraping
Parameters
Github
Open Source
Aframe
Filesystems
Servlets
Azure Devops
Mono
Windows
Kibana
Content Management System
Groovy
Vba
Prolog
Cypress
Logstash
Pascal
Mips
Youtube
Caching
Ssis
Interface
Ftp
Function
Reporting Services
Shell
Swift2
Google Compute Engine
Oracle Apex
Calendar
Design Patterns
Java 8
Amazon Ec2
Sharepoint 2010
Ssas
Generics
Serial Port
Animation
.net
Checkbox
Spring Boot
Mapping
Rest
C# 3.0
Office365
Login
Lambda
Pip
Drupal
Google Plus
Notepad++
Vaadin
Tableau Api
Sml
Winapi
Replace
Vector
Testng
Internet Explorer
Rdf
Windows Phone 7
Ag Grid
Moodle
Asp.net Mvc 2
Apache Camel
Merge
Codenameone
Dns
Reference
Arduino
Composer Php
Firefox Addon
Cocos2d X
Yii
Rally
Java Me
Mpi
Gcc
Arm
Reflection
Graphql
Activerecord
R
Entity Framework 4
Jsp
Scheme
Mongodb
Nestjs
Postman
Web Crawler
Perl
Mysql
Nest
Sharepoint 2013
Nunit
Azure Ad B2c
Module
Gtk
Influxdb
X86
Optimization
Spring Security
Magento
Google Calendar Api
Oracle
Random
Maven
Google Maps Api 3
Graphviz
Xamarin.forms
Sap
Blackberry
Combobox
Odoo
Java
Grails
Unicode
Eclipse Rcp
Embedded
Active Directory
Concurrency
Serialization
Hyperlink
Octave
Pycharm
Kendo Ui
Cassandra
Fluent Nhibernate
Robotframework
Elm
Jsf 2
Jquery
Arrays
Bazel
Https
Gulp
Gmail
Eclipse
Browser
Webview
Drupal 7
Scrapy
Dictionary
Nginx
Discord
Go
File Io
Uml
Scripting
.net Core
Email
Collections


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网