Python：在解析html代码时跳过行并去掉空格_Python_Html_String_Beautifulsoup_Html Parsing - Fatal编程技术网

Python：在解析html代码时跳过行并去掉空格

python html string

Python：在解析html代码时跳过行并去掉空格,python,html,string,beautifulsoup,html-parsing,Python,Html,String,Beautifulsoup,Html Parsing,我有以下html代码： html_doc = """ <h2> API guidance for developers</h2> <h2>Images</h2> <h2>Score descriptors</h2> <h2>Downloadable XML data files (updated daily)</h2> <h2>

我有以下

html

代码：

html_doc = """
<h2> API guidance for developers</h2>
<h2>Images</h2>
<h2>Score descriptors</h2>
<h2>Downloadable XML data files (updated daily)</h2>
<h2>
                                    East Counties</h2>
<h2>
                                    East Midlands</h2>
<h2>
                                    London</h2>
<h2>
                                    North East</h2>
<h2>
                                    North West</h2>
<h2>
                                    South East</h2>
<h2>
                                    South West</h2>
<h2>
                                    West Midlands</h2>
<h2>
                                    Yorkshire and Humberside</h2>
<h2>
                                    Northern Ireland</h2>
<h2>
                                    Scotland</h2>
<h2>
                                    Wales</h2>
"""

预期结果：

East Counties
East Midlands
London
North East
...

我做错了什么？

您可以在这里使用

切片

，因为

find\u all

返回一个列表类型，这样您就可以处理它的索引，如

[4::

和忽略空白使用

strip（）

您可以在这里使用

slicing

，因为

find\u all

返回一个列表类型，这样您就可以处理它的索引，如

[4:

和忽略空白使用

strip（）

为什么你不能直接使用

soup.find_all（'h2'）[4://code>？为什么你不能直接使用soup.find_all（'h2'）[4://code>？
East Counties
East Midlands
London
North East
...

for h2 in soup.find_all('h2')[4:]:
    print(h2.text.strip())

East Counties
East Midlands
London
North East
North West
...    

from bs4 import BeautifulSoup

soup = BeautifulSoup(html_doc, 'html.parser')

for h2 in soup.find_all('h2')[4:]: # slicing to skip the first 4 elements
    print(h2.text.strip()) # get the inner text of the tag and then strip the white space




[html]相关文章推荐



                                                        
Html 用css自动扩展购物车
htmlcss 
Html 在全屏背景中居中对齐内容？
htmlcss 
当我将粘贴复制到另一个文档中时，HTML不起作用
htmlvb.net 
Html 固定宽度div将浮动文本推离屏幕
htmlcss 
html在outlook中看起来很奇怪，但在浏览器中可以
htmlencodingutf-8outlook 
Html css在不使用其他表格的情况下以不同方式对齐表格行
htmlcss 
Html 控制水平子AV的高度
htmlcss 
Html 防止网页在Internet Explorer 7中呈现
htmlinternet-explorer 
Html 我的CSS导航栏在浏览器中有时会被破坏（重新加载时很好）
htmlcss 
使用HTML5画布时，将渲染的HTML5显示（可见和不可见）转换为图像
htmlimagehtml5-canvas 
Html 下载整个网站wget上.zip文件的所有链接
htmlwebcommand-lineterminal 
Html 在另一个svg中调用外部svg
htmlcanvassvg 
Html 仅使用CSS控制元素的位置
htmlcss 
Html 为什么不把它自己结合起来呢
htmlcss 
Html 创建字形图标，图标不显示
htmlcsssvg 
Html 角度2模式弹出超过100%的高度和滚动，不友好的用户体验
htmlcssangular 
Html Don'；t显示时间戳&；迭代信息
htmlruby-on-rails 
Html CSS文本需要在动画之后删除
htmlcss 
HTML5视频加载速度慢，而且似乎只能在Chrome上运行
htmlperformance 
Html 谷歌日历嵌入问题：手机
htmlcsscalendarshopifygoogle-calendar-api 
                                       





随机文章推荐



                                                        
Awk 在linux中如何逐行求和？
awk 
使用awk从多个文本文件中提取列
awk 
Awk 返回值的shell脚本
awk 
需要帮助了解以下代码awk（&；&；）代码：
#/垃圾箱/awk-f
{
如果（长度（$0）
awk 
Awk 比较两个文件中的两列
awk 
awk-跳过标题，添加列
awk 
Awk 根据满足第二个文件指定的条件的文件中的值更新计数
awk 
如何确定两个值之间的差值是否在awk范围内？
awk 
Awk 知道文件中的位置时递归搜索文件内容
awksedgrep 
Awk grep提前停止，每个模式一个匹配
awkgrep 
如何使用sed或awk在两个单词之间找到匹配模式
awksedgrep 
Awk 如果特定列中的值唯一，则仅输出行
awk 
如何在awk中手动设置记录分隔符？
awk 
使用awk，根据第2列和第5列中的字符串以及第3列中的值计算行的平均值，并追加结果
awk 
将变量添加到列条目awk
awk 
需要用双引号中的相同字符串替换文本文件中以0开头的所有字符串（除了having/and.）
awk'{for（i=1；i
awk 
Awk 如何获取特定模式之间的数据？
awk 
Awk 使用csv文件的摘要数据
awk 
Awk 查找匹配项并用数字序列替换
awksed 
需要使用awk将日期时间拆分为两个单独的字段
awk


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python Django日志报告没有进入我的gmail
									Python
							 									Django
							 									Logging
							 
使用sphinx创建Python模块的文档，添加包含C包装器的模块
									Python
							 									C
							 									Python Sphinx
							 
在执行pytesseract代码Python时最小化或禁用cmd窗口
									Python
							 
Python 是否有任何命令行工具用于解析coverage.xml并突出显示遗漏的行？
									Python
							 
Python:变量赋值中方法调用的属性错误，但未打印
									Python
							 
Python Django:'；ValueError:type'；v'；不支持'；当尝试运行Shell时
									Python
							 									Django
							 
Python 结构化numpy数组中的这列0是什么？
									Python
							 									Numpy
							 
在Python中从命名元组列表中提取第n个元素？
									Python
							 									List
							 									Pandas
							 
Python TensorFlow-使用字符串字段
									Python
							 									Tensorflow
							 
Python 安装模块子类型\u id时出现odoo 11错误
									Python
							 									Windows
							 									Odoo
							 
Python-如何使用额外安装的包数据
									Python
							 
Python DictVectorizer为训练集学习更多功能
									Python
							 									Numpy
							 									Scikit Learn
							 
Python线程信号
									Python
							 									Multithreading
							 									Python 3.x
							 
从python写入文本文件
									Python
							 									Python 3.x
							 
Python 以有效方式安装平衡面板（向前填充）
									Python
							 									Pandas
							 
Python Bokeh未从CheckboxGroup更新打印线更新
									Python
							 									Plot
							 
如何在Python中构造循环中的条件？
									Python
							 									Pandas
							 
Python 如何使用read_sql为列匹配和不匹配插入标志
									Python
							 									Mysql
							 									Pandas
							 
Python 根据另一个数据帧中的信息编辑数据帧中的值
									Python
							 									Pandas
							 									Dataframe
							 
Python 如何利用SVM的线性svc来获得准确率和召回率？
									Python
							 									Scikit Learn
							 
Python：如何从数据帧创建字典？
									Python
							 									Dictionary
							 
Python初学者：使用循环创建具有动态属性的动态类对象
									Python
							 
Python ：不支持-：'的操作数类型；str'；和'；str'；
									Python
							 									Pandas
							 
Python 要更改的正则表达式\by/
									Python
							 									Regex
							 
Python 将滚动条添加到选项卡PYQT5中
									Python
							 									Tabs
							 
Python 减去'；n'；从当前日期算起的周数
									Python
							 									Datetime
							 
Python Selenium使用elif查找元素
									Python
							 									Selenium
							 									If Statement
							 
Python 如何正确使用这里的列表？
									Python
							 									List
							 
Python 每n批而不是使用pytorch的EPOCH后的输出评估损失
									Python
							 									Pytorch
							 
Python 如何计算和显示程序运行的次数？
									Python
							 									Python 3.x
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
C# 4.0
Servlets
Windows Installer
Tinymce
Ubuntu
Linker
Cors
Dom
Antlr4
Ecmascript 6
Knockout.js
Socket.io
Cypress
Swift3
Smtp
Asp.net Mvc
Activemq
Sencha Touch 2
Replace
Linux
Process
Sip
Jira
Floating Point
Netlogo
Kubernetes
Node.js
Xml
Join
Authentication
Cloud
Material Ui
Pip
Opengl
Spring Cloud
Wpf
Prometheus
Iphone
Air
Gremlin
Three.js
Io
Swift2
Rabbitmq
Scikit Learn
Glassfish
Office365
Random
Smalltalk
Class
Html
Spring Batch
Plsql
Actionscript 3
Calendar
Kernel
Amp Html
Jmeter
Selenium Webdriver
Coffeescript
Quickbooks
File Io
.net 4.0
Validation
Concurrency
Optimization
Javafx
Core Data
Ip
Virtual Machine
Forms
Cassandra
Graphql
Recursion
Filter
Azure Data Factory
Ibm Mq
Pagination
Uitableview
Mapbox
Log4net
Verilog
Clojure
Tsql
Appium
Intellij Idea
Sms
Gwt
Mongodb
Syntax
Bazel
Interface
Akka
Visual C++
Indexing
Logstash
Eclipse Plugin
Pytorch
Jar
Haskell
Merge
Acumatica
Amazon Redshift
Go
Programming Languages
Microservices
Raspberry Pi
Grid
Eclipse
Service
Meteor
Cocoa Touch
Windows Store Apps
Discord.js
Pandas
Continuous Integration
Fiware
Nestjs
Seo
Configuration
Windows Runtime
Groovy
Vue.js
Internet Explorer
Applescript
Silverlight
Serialization
Umbraco
Google Bigquery
Sitecore
Office Js
Orientdb
Winapi
For Loop
Input
Openerp
Unix
Ipython
Nhibernate
Gmail
Directx
Airflow
Svn
Google Cloud Dataflow
Url
Ssh
Report
Rx Java
Version Control
C#
Blockchain
Hive
Ibm Midrange
Memory
Laravel 5
Erlang
Time
Terminal
Razor
Regex
Character Encoding
Keras
Variables
Jpa
Python 2.7
Axapta
Imagemagick
Data Binding
Computer Vision
Typescript
Prestashop
View
Java Me
Tomcat
Cmake
Xamarin.ios
Design Patterns
Jwt
Openlayers 3
Rss
Twitter
Iis
Mapping
Llvm
Loops
Url Rewriting
Sas
Xamarin.forms
Cron
Xpath
Tridion
Angular
Dns
Fullcalendar
Asp.net Mvc 5
Maven 2
Dependency Injection
Azure Sql Database
Events
Enums
Vagrant


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网