Java 使用htmlparser解析网站时无法获取所有匹配的节点_Java_Html Parser - Fatal编程技术网

Java 使用htmlparser解析网站时无法获取所有匹配的节点

java

Java 使用htmlparser解析网站时无法获取所有匹配的节点,java,html-parser,Java,Html Parser,我正在使用HTMLPasser解析一个网站，但我遇到了一个非常奇怪的问题。我正在尝试获取网页上的所有节点，我的代码如下： String url = "http://s.1688.com/selloffer/offer_search.htm?keywords=%BD%A8%B2%C4&n=y&categoryId="; Parser parser = new Parser(url); parser.setEncoding("gb2312"); NodeList list = pa

我正在使用HTMLPasser解析一个网站，但我遇到了一个非常奇怪的问题。我正在尝试获取网页上的所有

节点，我的代码如下：

String url = "http://s.1688.com/selloffer/offer_search.htm?keywords=%BD%A8%B2%C4&n=y&categoryId=";
Parser parser = new Parser(url);
parser.setEncoding("gb2312");

NodeList list = parser.extractAllNodesThatMatch(new TagNameFilter("li"));
// NodeList list = parser.parse(new CssSelectorNodeFilter("li[class=\"sm-offerShopwindow\"]"));
System.out.print(list.size() + "\n");
for (int i = 0; i < list.size(); i++) {
Node li = list.elementAt(i);
System.out.print("text:" + li.getText() + "\n");
}

stringurl=”http://s.1688.com/selloffer/offer_search.htm?keywords=%BD%A8%B2%C4&n=y&categoryId=";
解析器=新的解析器（url）；
解析器.setEncoding（“gb2312”）；
NodeList list=parser.extractAllNodesThatMatch（新标记名过滤器（“li”）；
//NodeList list=parser.parse（新的CssSelectorNodeFilter（“li[class=\”sm offerShopwindow\“]”）；
System.out.print（list.size（）+“\n”）；
对于（int i=0；i


但是列表大小的输出总是20。它似乎并没有遍历该页面上的所有节点。为什么？谢谢你的建议
 即使是最顶尖的浏览器也不总是同意如何解析那些假装是HTML的奇怪东西，而且，自2006年以来，网络发展得非常迅速。因此，如果这样一个旧的软件无法处理现代HTML，我也不会感到惊讶。
这是哪个解析器？我使用的是htmlparser。@HaraldWhich package？开源的东西？家酿什么？这是一个开源的罐子。它的主页是，但事实是，我尝试了一些其他网页，它工作得很好，所以我怀疑有任何机会的具体网页课程的问题？




[jetty]相关文章推荐



                                                        
ActiveMQ内部的Jetty:Web控制台URL
jettyactivemq 
Jetty 8服务器无法找到org.springframework.web.servlet.tags包
jetty 
嵌入式Jetty在未知位置缓存JSP
jetty 
jetty access.log不再记录日志
jetty 
Jetty javax.faces.application.application.getELResolver（application.java:443）
jetty 
如何配置嵌入式Jetty来处理选项飞行前请求？
jettycors 
在Jetty中加载webapp外部的属性文件
jetty 
使用嵌入式Jetty或Spark Java的ApacheShiro-可能吗？
jetty 
                                       





随机文章推荐



                                                        
Safari'有解决办法吗；s/Opera&x27；你可以'；通过超链接的t标签？
safari 
Safari扩展-响应消息的注入脚本太多
safari 
如何在safari中查看网络请求？
safari 
Safari无法检测开发人员证书
safaricertificate 
@font-face-font中的符号不会在Safari 5中显示，而是在Safari 6和其他浏览器中正确显示
safari 
如何在safari 5.1.7版本中启用主动响应设计模式
safariwindows-10 
Safari扩展应用程序未显示在Safari首选项扩展选项卡中
safari 
Vimeo autoplay不工作Safari 11
safari 
Safari 画布抛出错误为'；错误：未捕获（承诺中）：安全错误：操作不安全。toDataURL@[本机代码]'；
我在一个图像编辑器中工作，我需要将视频设置为画布背景
所以我使用了fabricjs版本1.7.22，它太旧了，但由于它的复杂性，我无法在我的项目中进行更新
我首先创建一个html视频元素，然后将该元素插入fabricjs对象的var img=new fabric.Image（htmlVideoElement）中
然后我将fabricJS img对象设置为画布背景，如canvas.setBa
safari


                                        

                                        
                                        


                                                
                                                        [java]相关推荐
                                                        
运行Debian 6的设备上的javax.comm.CommPortIdentifier.getPortIdentifiers（）为空
									Java
							 									Debian
							 
Java 注释和处理器之间的匹配
									Java
							 									Junit
							 									Intellij Idea
							 
JavaFXImageView如何使用css悬停
									Java
							 									Css
							 									Javafx
							 
Java 如何使用服务器将客户端重定向到彼此直接连接
									Java
							 									Sockets
							 									Server
							 
Java XSLT未按预期工作
									Java
							 									Xslt
							 
Java：有没有办法从字节数组中获取ZipFile（或任何使用直接getEntry方法的东西）？
									Java
							 									Arrays
							 
Java Jetty 9-嵌入式-无法启动Web应用程序上下文
									Java
							 									Xml
							 									Jetty
							 
Java 使用日期列（dd/mm/yyyy）对Csv进行排序
									Java
							 									Date
							 									Csv
							 
Java XPages：丢失一个ViewScope bean（再次）
									Java
							 									Xpages
							 
Java 无法从外部jar文件加载spring配置xml
									Java
							 									Spring
							 									Spring Mvc
							 									Spring Integration
							 
Java 我需要用截击库返回结果
>公共void makeJsonObjectRequest（长s、双lat、双lon、int
>时区）{
>字符串urlJsonObj=”http://projet.dev.e-njaz.com/api/example/getPrayerTimes/“+s+”/”+
>纬度+“/”+lon+“/”+时区；
>JsonObjectRequest JSONObjectReq=新的JsonObjectRequest（Request.Method.GET，
>urlJsonObj，null
									Java
							 									Android
							 
带contains选项的java筛选器的aspose单元格
									Java
							 
Java gson的json和包装器
									Java
							 									Json
							 									Jira
							 
Java 如何测试循环中的多个字母
									Java
							 									Loops
							 									If Statement
							 
Java JScrollPane和JTextArea滚动
									Java
							 
Java 不兼容ClassChangeError:类hbase.client.ConnectionManager$HConnectionImplementation未实现接口hbase.client.Connection
									Java
							 									Hbase
							 									Apache Zookeeper
							 
Java 在antlr4中将自定义异常添加到Lexer/Parser文件的正确方法
									Java
							 									Parsing
							 									Error Handling
							 									Exception Handling
							 									Antlr4
							 
读取大型CSV文件时出现Java内存不足消息
									Java
							 									Csv
							 
Java 将log4j.xml的属性配置外部化
									Java
							 									Xml
							 									Logging
							 									Log4j
							 
Java 数据库-有2个表，需要另一个既有ID又有另一个字段的表
									Java
							 									Mysql
							 									Database
							 									Spring
							 									Hibernate
							 
Java 如何删除短列表视图末尾的空格？
									Java
							 									Android
							 									Listview
							 
Quickbooks Java IDE需求
									Java
							 									Quickbooks
							 
Java Hibernate SessionFactory-创建工厂、会话和处理资源的正确方法
									Java
							 									Hibernate
							 									Exception Handling
							 
Java I'；我正在写一个关于模数的程序
									Java
							 
Java 如何使用json从servlet检索值到jsp
									Java
							 									Arrays
							 									Jsp
							 
Fasterxml将json转换为java pojo
									Java
							 									Json
							 
Java 如何删除对话框片段并直接转到spesific类使用意图
									Java
							 									Android
							 									Android Fragments
							 
无法调试IntelliJ中的Java代码（使用Tomcat）-文件系统缓存无效。需要重建
									Java
							 									Debugging
							 									Tomcat
							 									Intellij Idea
							 
如何在Java中显示数组中最大相同的相邻元素
									Java
							 									Arrays
							 									Loops
							 									Sorting
							 
Java 尝试使用会话跟踪在jsp中访问实体类对象属性，但它显示错误？
									Java
							 									Jsp
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Netty
Openssl
Directx
Web Scraping
Ruby On Rails 3.2
Transactions
Recursion
Migration
Socket.io
Wxpython
Pip
Servlets
Axapta
Jupyter Notebook
Proxy
Apache Flex
Mips
Blazor
Google App Maker
Mapping
Gruntjs
Spring Batch
Macos
Requirejs
Dojo
Time
Functional Programming
Actionscript 3
Asynchronous
Netsuite
Google Bigquery
.net
Git
Unix
Types
C#
Zsh
Swing
Gulp
Next.js
Itext
Jquery Mobile
Compression
Push Notification
Ide
Couchdb
Elixir
Graphql
Wcf
Snmp
Open Source
Windows 8
Asp.net Mvc 2
Syntax
Glassfish
Image Processing
Qt4
Database Design
Vmware
Ldap
Aws Lambda
Haskell
Ansible
Tinymce
Interface
Plone
Doctrine
Twig
Aframe
Printing
Terraform
Azure Ad B2c
Ssrs 2008
Colors
Yocto
Build
Java
Cocoa Touch
Authentication
Directory
Windows Phone 8
Tsql
Sip
Performance
Hyperlink
Iframe
Com
Biztalk
Android Studio
Linux Kernel
Windows Store Apps
Search
Mfc
Menu
Xpath
Mercurial
Markdown
Indexing
Llvm
Sockets
Loopbackjs
Jira
Cygwin
Actionscript
Mariadb
Google Colaboratory
Notifications
Kentico
Audio
Ios8
Flutter
Iphone
Eclipse Rcp
Programming Languages
Objective C
Keyboard
Ios5
Import
Shopify
Websocket
Documentation
Ag Grid
Hyperledger Fabric
Smalltalk
Smtp
Eclipse Plugin
Neural Network
Express
Bots
Gis
Hash
Jaxb
Sonarqube
Rabbitmq
Ajax
Activerecord
Heroku
Regex
Grid
Razor
Dns
Sql Server 2008
Prestashop
Character Encoding
Apache Kafka
.htaccess
Anaconda
Matlab
Apache Zookeeper
Testng
Sql Server
Active Directory
Input
Apache Camel
Knockout.js
Plugins
Django Rest Framework
Rspec
Xamarin.ios
Lua
Post
Mule
Wolfram Mathematica
Xmpp
Frameworks
Applescript
Drop Down Menu
Logic
Gtk
Shiny
Udp
Cloud Foundry
Windows Services
Swift3
Jpa
Blockchain
Cocos2d Iphone
Prometheus
Devexpress
Openlayers 3
Cluster Computing
Dependencies
Symfony1
Login
Cordova
Cassandra
Lucene
Sharepoint
Teradata
Vector
Netbeans
Nosql
Coq
Ubuntu
Angular Material
Random
Raspberry Pi
Tomcat
Opencart
Scikit Learn
Json


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网