Java 从html文件获取信息_Java_Html_Parsing - Fatal编程技术网

Java 从html文件获取信息

java html parsing

Java 从html文件获取信息,java,html,parsing,Java,Html,Parsing,我正在编写一个程序，从页面中获取信息并将其放入excel文件中问题是，我没有找到一种方法来搜索带有特定信息的标签这是我的代码（到目前为止）： private void getAll（）引发IOException{ 对于（inti=0；iif（line.equalsIgnoreCase（“”{} 该if语句正在检查是否完全相等（忽略大小写），但该行上可能有其他内容，例如空格你可能想要的是 if (line.toLowerCase().contains("<div class=\"su

我正在编写一个程序，从页面中获取信息并将其放入excel文件中

问题是，我没有找到一种方法来搜索带有特定信息的标签

这是我的代码（到目前为止）：

private void getAll（）引发IOException{
对于（inti=0；iif（line.equalsIgnoreCase（“”{}

该if语句正在检查是否完全相等（忽略大小写），但该行上可能有其他内容，例如空格
你可能想要的是
if (line.toLowerCase().contains("<div class=\"subcontent\">") { }

if（line.toLowerCase（）包含（“”{}
试着从开始使用
看看外部解析器库吧？试一下这个：已经试过了，没用，我发现修改后的api有点难。这确实是你最好的选择；jsoup可能是更好的选择，还有很多例子！）快速提问，如何获取结束标记？如果（line.toLowerCase（）.contains（“”）包含（“”），您可以继续解析行，直到有一行通过，实际上，我收回这一点——如果存在嵌套div，您将遇到问题。如果需要达到这种复杂程度，您可能需要使用XML解析器
if (line.equalsIgnoreCase("<div class=\"subcontent\">"){ }

if (line.toLowerCase().contains("<div class=\"subcontent\">") { }




[html]相关文章推荐



                                                        
TinyMCE+；html5图形、img&；figcaption插件/插入
htmltinymce 
如何使用HTML5和CSS3在文本字段上显示光晕
htmlcss 
html src和href属性的相对路径或url
html 
Html 调整和定位容器内的DIV
htmlcss 
Html 带图像的注销链接
htmlimagehyperlink 
Html 你能帮我用“a”吗；图标字体“；在搜索栏中仅使用CSS打开搜索栏？
htmlcssdom 
Html 可以在自定义引导框中添加mailto链接吗？
htmltwitter-bootstrap-3 
Html 框架集不显示页面
htmlhyperlink 
Html 导航链接不可点击
html 
Html 如何阻止boostrap下拉列表部分隐藏在下一个表格行下面
htmlcsstwitter-bootstrap 
Html 如何将侧边栏连接到页脚？
htmlcss 
Html 仅CSS砌体布局
htmlcss 
Html 浏览器是否会加载相同的图像文件（如果'；在同一页中调用多次？
htmlbrowser 
Html Flexbox行反向打断对齐IE 11上的项目
htmlcssgoogle-chrome 
Html 如何将连续的nowrap跨距包装为单独的图元？
htmlangulartwitter-bootstrapcss 
Html 仅CSS侧导航在路由时不关闭
htmlcssangular 
Html 引导网格未扩展到整个屏幕宽度
htmlbootstrap-4 
从html图像中删除选定的大纲
htmlcssselect 
Html Flexbox-搜索框下方的搜索结果弹出窗口
htmlcss 
Html 将第二个对象放置在第一个对象下方
htmlcss 
                                       





随机文章推荐



                                                        
Transactions 企业库：回滚多个事务
transactions 
Transactions 在事务中使用提交是否足够？
transactions 
Transactions Neo4j中的嵌套事务
transactionsneo4j 
Transactions 如何对NEO4J进行事务查询？
transactionsneo4j 
Transactions Neo4j中的读隔离
transactionsneo4j 
Transactions 在同一事务中使用marklogic dls API更新内容摄取和属性
导入模块命名空间dls=”http://marklogic.com/xdmp/dls“at”/MarkLogic/dls.xqy”；
让$uri:=“/ml workflow/test2.xml”
let$content:=苹果
let$properties:=芒果
返回
（dls：文档插入和管理（$uri，fn:false（），$content），dls：文档集属性（$uri，$properties））
transactionsxquerymarklogic 
Transactions Cirqus-回滚事件
transactions 
Transactions 如何在authorize.net沙箱中结算付款？
transactions 
Transactions 从Cassandra获取当前值-使用时间戳更新？
transactionscassandra 
Transactions 有没有办法防止批处理在发生跳过时重复处理同一块/项目？
transactionsspring-batch 
Transactions 在JMETER中-如何在API测试的每个单独请求级别实现TPS
transactionsjmeter 
Transactions 我可以让并发事务等待还是失败？
transactions 
Transactions 在长时间运行的进程中保持池中的连接
transactions


                                        

                                        
                                        


                                                
                                                        [java]相关推荐
                                                        
Java 树状结构
									Java
							 
Java 如何使用Springbeans执行方法
									Java
							 									Spring
							 
Java缓冲区图像分辨率
									Java
							 									Image
							 
Java 使用android内部API并获取空值
									Java
							 									Android
							 
Java数组每次执行时都打印下一个元素
									Java
							 									Arrays
							 
Java 两个片段之间共享的一个连接
									Java
							 									Android
							 									Networking
							 
在Java持久性会话作用域中使用SQL Server变量？
									Java
							 									Sql Server
							 									Hibernate
							 									Session
							 
Java LDAP在一个查询中获取多个级别的直接报告
									Java
							 									Ldap
							 
Java AGPS设置加载，而不是位置和安全
									Java
							 									Android
							 									Gps
							 
Java 如何在Gwt多入口点项目应用程序中减少初始加载时间
									Java
							 									Javascript
							 									Gwt
							 
Java 如何创建对象引用变量数组？
									Java
							 									Arrays
							 									Variables
							 									Reference
							 
Java场景生成器2.0，在编辑器中Tab2是否切换到Tab1？
									Java
							 									Javafx
							 
无法在java中使用FIT runner运行FIT测试
									Java
							 									Eclipse
							 
Java 重头戏1.3-JPABase InvalidClassException
									Java
							 									Hibernate
							 									Jpa
							 									Playframework
							 
Java 类别为SectionHeader的自定义ListView（使用自定义游标适配器）
									Java
							 									Android
							 									Sqlite
							 									Listview
							 
试图在Java中返回分数（作为浮点）
									Java
							 									String
							 									Floating Point
							 
Java 从数组中删除唯一值
									Java
							 									Arrays
							 									Groovy
							 
Java 创建简单SpringAOP时遇到异常抛出建议演示
									Java
							 									Xml
							 									Spring
							 									Maven
							 									Spring Mvc
							 
Java 如何获取多维数组中对象的索引？
									Java
							 
Java Log4j2 RollingFileAppender生成器方法返回类型错误
									Java
							 									Logging
							 
Java 堆层上的EhCache:未找到序列化程序
									Java
							 
Java代码无法从资源加载静态文件
									Java
							 									Maven
							 
Java 替代CDI实施-WELD-001408：使用限定符@Default的类型存储库的未满足依赖项
									Java
							 									Jakarta Ee
							 
如何判断键是否包含在Hashmap中未命名的Hashmap中？Java，JavaFX
									Java
							 									Javafx
							 
Java中的文件拆分代码未按要求工作
									Java
							 									File Io
							 
Java Docker image无法将我的JSON凭据密钥添加到我的Google云自然语言服务客户端
									Java
							 									Docker
							 									Google Cloud Platform
							 
Java Flink与行时列自动联接
									Java
							 									Apache Flink
							 
Java Spring MVC项目中的HTTP服务器状态404错误
									Java
							 									Spring
							 									Tomcat
							 									Model View Controller
							 
Java 如何将url从一个类传输到另一个活动
									Java
							 									Android
							 
Java Android studio-谷歌地图：检查人是否在圈中
									Java
							 									Android
							 									Google Maps
							 									Geometry
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Generics
Frameworks
Netsuite
Sed
Concurrency
Aem
Twilio
Bootstrap 4
Azure Active Directory
Eclipse Plugin
Scripting
Apache Kafka
Doxygen
Amazon Ec2
Angular Material
Charts
Codenameone
Gwt
Websocket
Programming Languages
Mapreduce
Cakephp
Spring Integration
Domain Driven Design
Chef Infra
Memory Management
Elm
Serialization
Ecmascript 6
Indexing
Youtube Api
Clojure
Azure Functions
Visual Studio 2010
Configuration
Codeigniter
Aframe
Deployment
Html
Qt4
Symfony1
Playframework
Ios6
Yii2
Ide
Javafx
Wpf
Networking
Chart.js
C++11
Eclipse Rcp
Vb.net
Nestjs
Push Notification
Odoo
Phpunit
Powershell
Uml
Sqlalchemy
Ethereum
Binding
Vagrant
Adobe
Wolfram Mathematica
Syntax
Requirejs
Sugarcrm
Google Chrome
Windows Phone 8.1
Synchronization
Docker Compose
Kernel
Glsl
Sql
Open Source
Python 2.7
Web Crawler
Nsis
Assembly
Android Studio
Flutter
Time
Ruby On Rails 3.1
Ssh
Twitter Bootstrap 3
Coq
Dotnetnuke
Database
Pyspark
Ibm Midrange
Coding Style
Google Cloud Platform
Visual Studio 2015
Shopify
Image Processing
Zurb Foundation
Compilation
Spring Security
Orm
Migration
Java Me
Input
Gtk
Camera
Url Rewriting
Zsh
Postgresql
Ssl
Azure Sql Database
Image
Android Emulator
Download
Linkedin
Ruby
Firebase
Sonarqube
Cmake
Mapping
Kotlin
Security
Xml
Uitableview
Sharepoint 2007
Sequelize.js
Tridion
Android Layout
Excel Formula
Pycharm
Hyperledger Fabric
Flash
Bazel
Dart
Jasmine
Jpa
Xslt
Salesforce
Windows Runtime
Maven
.net Core
Spring Boot
Dns
Algorithm
Typo3
Asp.net Mvc 5
Vba
Sockets
Listview
Http
Graph
Laravel 5
Variables
Certificate
Amazon Redshift
Drupal 7
Compiler Construction
Python 3.x
Openlayers 3
Process
Leaflet
Mips
Phantomjs
Apache Flink
Doctrine Orm
Gulp
Audio
Path
Java
Sphinx
Sbt
Calendar
Tfs
Vb6
Timer
Grid
Ip
Nginx
Post
Ruby On Rails 3
Awk
Combobox
Sails.js
Reflection
Gruntjs
Sparql
Angular
Vbscript
Razor
Udp
Drupal
Javascript
Join
Jar
Snowflake Cloud Data Platform
Stm32
Crystal Reports
E Commerce
Maps
Gps
Solr
Parsing
Azure


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网