Java 环路内呼叫控制器（爬虫4J-3.5）_Java_Web Crawler_Crawler4j - Fatal编程技术网

Java 环路内呼叫控制器（爬虫4J-3.5）

java web-crawler

Java 环路内呼叫控制器（爬虫4J-3.5）,java,web-crawler,crawler4j,Java,Web Crawler,Crawler4j,您好，我正在调用控制器内部for loop，因为我有100多个url，所以我有一个all-in列表，我将迭代和爬网页面，我也为setCustomData设置该url，因为它不应该离开域 for (Iterator<String> iterator = ifList.listIterator(); iterator.hasNext();) { String str = iterator.next(); System.out.println("cheking"+str);

您好，我正在调用

控制器内部for loop
，因为我有100多个url，所以我有一个all-in列表，我将迭代和爬网
页面，我也为setCustomData设置该url，因为它不应该离开域
for (Iterator<String> iterator = ifList.listIterator(); iterator.hasNext();) {
    String str = iterator.next();
    System.out.println("cheking"+str);
    CrawlController controller = new CrawlController(config, pageFetcher,
        robotstxtServer);
    controller.setCustomData(str);
    controller.addSeed(str);
    controller.startNonBlocking(BasicCrawler.class, numberOfCrawlers);
    controller.waitUntilFinish();
}

请帮我解决上面的解决方案，我在循环中启动并运行控制器，因为我在列表中有很多url
注意：*我正在使用**crawler4j-3.5.jar及其依赖项。
尝试：
for(String url : urls) {
    controller.addSeed(url);
}

并覆盖shouldVisit（WebUrl）
，使其不能离开域
for(String url : urls) {
    controller.addSeed(url);
}




[web crawler]相关文章推荐



                                                        
Web crawler 如何抓取数十亿页？
web-crawler 
Web crawler 调查结果；“全部”；国域
web-crawler 
Web crawler 同一项目中不能有两个spider？
web-crawlerscrapy 
Web crawler 在爬网产品详细信息页面时动态分配列？
web-crawler 
Web crawler Scrapy：如何忽略所有Javascript、JQuery。。。刮的时候
web-crawlerscrapy 
Web crawler 如何在sparql中自动递增变量？
web-crawlersparql 
Web crawler Nutch抓取超时
web-crawler 
                                       





随机文章推荐



                                                        
Docker compose docker compose上cloudant的URL
docker-compose 
如何在节点导出器的docker-compose.yml文件中启用systemd collector
docker-composeprometheus 
Docker compose TestContainers：重用DockerComposeContainer中的网络以在其他GenericContainer中使用？
docker-compose 
Docker compose 如何重新发行let'；s在docker上为Trafik添加新子域/多个域时进行加密，并配置重构
我之前添加额外域的努力只是为了

码头工人放下
删除acme.json文件
在traefik.toml中为新域添加另一节
docker compose up-d
生成了新的acme.json
docker-compose 
Docker compose 使用docker compose配置的skaffold init失败，返回“0”；零指针解引用；错误
docker-compose 
Docker compose docker撰写ts节点问题
docker-composenestjs 
Docker compose 无法使Prisma与包含数据的现有MySQL DB一起工作
docker-composegraphql 
Docker compose 如何在docker compose文件中配置Caddy 2，以便在没有绑定挂载的Caddy文件的情况下执行反向代理？
docker-compose 
Docker compose 如何使用Azure CI-CD管道将ASP.Net docker容器化应用程序部署到本地服务器？
docker-composeazure-devops 
Docker compose 如何将第二个wordpress容器添加到docker服务器？
docker-compose 
Docker compose 在容器停止之前，使用docker compose执行脚本
docker-compose 
Docker compose Traefik 2.4+；LetsEncrypt-示例无法获取域的ACME证书
docker-compose


                                        

                                        
                                        


                                                
                                                        [java]相关推荐
                                                        
Java 红黑树平衡？
									Java
							 									Algorithm
							 
Java 理解BST树中的递归函数
									Java
							 
Java 是否有一个健壮的实现或库来高效、快速地获取准确的位置？
									Java
							 									Android
							 
Java 通过向列表中添加项目来避免ConcurrentModificationException异常
									Java
							 									List
							 
Java 使用toString（）方法打印
									Java
							 									String
							 									Methods
							 									Printing
							 
Java Android异步任务-
									Java
							 									Android
							 									Multithreading
							 
Java 双精度到字符串转换错误
									Java
							 									Android
							 									Eclipse
							 
Java 为什么自动布线没有'；不行？
									Java
							 									Spring
							 									Hibernate
							 									Spring Mvc
							 
Java 如何获取LinkedList的总和（汇总LinkedList中的项目）
									Java
							 									Collections
							 
Java 阻止Jackson读取嵌入的部分JSON
									Java
							 									Json
							 
Java 不从片段中的JSON创建arraylist对象类（Android）
									Java
							 									Android
							 									Json
							 									Android Fragments
							 
Java 批处理RESTAPI调用
									Java
							 									Rest
							 
Java 为什么我会得到一个“；MySQLSyntaxErrorException:用户的访问被拒绝；错误？
									Java
							 									Mysql
							 									Spring
							 									Hibernate
							 									Jpa
							 
Java 在加工条件后，精确读取下一行中的字符串
									Java
							 
Java 插入带有变量的条件，仅当变量不为空时才选择字符串
									Java
							 
Java 带有1个线程的Thread.join（）
									Java
							 									Multithreading
							 
Java 我们如何将一个字符串列表与一个字符串进行比较
									Java
							 
Java Oracle jdbc驱动程序11，迁移后符号错误
									Java
							 									Oracle
							 									Jdbc
							 
Java jar文件不在驱动器中创建文件
									Java
							 									Intellij Idea
							 									Jar
							 
如何使用Java从操作系统加载数字证书？
									Java
							 									Ssl
							 
Java 如何使用共享库？
									Java
							 									C++
							 
Java Android Studio：在文件夹中显示图片列表？
									Java
							 									Arrays
							 									Android Studio
							 
Java 导入导致语法错误Eclipse
									Java
							 									Eclipse
							 									Excel
							 									Apache
							 
Java 将JButton添加到JPanel时，形状不会出现
									Java
							 									Swing
							 
Java Moshi JSON解析
									Java
							 									Android
							 									Json
							 
Java Android Studio-如何持续运行方法？
									Java
							 									Android
							 
java.sql.SQLSyntaxErrorException:ORA-00942:表或视图不存在
									Java
							 									Oracle
							 									Jdbc
							 
在Java中，是否有可能解码具有超过加密值的文本？
									Java
							 									Spring
							 									Encryption
							 									Hash
							 
如何在Java中通过套接字将2D数组发送到服务器
									Java
							 									Arrays
							 									Sockets
							 
Java 构造注入和JPA存储库
									Java
							 									Spring
							 									Dependency Injection
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Sencha Touch 2
Memory Leaks
Path
Ios
Blockchain
Ios7
Here Api
Discord
C++ Cli
Shopify
Amp Html
Java
Hadoop
Clang
Embedded
Sparql
Replace
Data Binding
Hash
Sharepoint
Sms
Struct
Stata
Ssl
Numpy
Racket
Computer Vision
Hyperledger Fabric
Command Line
Time Complexity
Ios8
Tensorflow
Llvm
Powershell
Ms Access
Lotus Notes
Plone
X86
Flash
Openshift
Excel Formula
Content Management System
Mapping
Loopbackjs
Kotlin
Xamarin.forms
Symfony
Cocoa Touch
Caching
Cygwin
Log4net
Phpmyadmin
Typo3
Knockout.js
Tcp
Api
Linker
Sql Server 2005
Excel
Angularjs
Wcf
Android Fragments
Angular
Wix
Fullcalendar
Hive
Oop
Parsing
Jqgrid
Sequelize.js
Magento
Jquery
Ethereum
Cocoa
Asp.net Mvc 5
Extjs
Project Management
Wordpress
Merge
Cuda
Windows Phone
Opencart
Dojo
Html
Artificial Intelligence
Uml
Mapbox
Debian
Aws Lambda
Network Programming
Ruby On Rails 4
Junit
Ruby On Rails 3
Rdf
C++11
Google App Engine
Dask
Mule
Data Structures
Salesforce
Webgl
Jmeter
Jhipster
Mfc
Elixir
Jasper Reports
Io
Sails.js
Deployment
Prolog
Polymer
Filter
Firebase
Atom Editor
Codeigniter
Colors
Algorithm
Swiftui
Dictionary
C#
Javafx
Tkinter
Openlayers 3
Math
Reactjs
Ibm Mq
Build
Yii2
Botframework
Hybris
Speech Recognition
Arrays
Jira
Node.js
Json
Editor
Hyperlink
Objective C
Blackberry
Azure Functions
Django Rest Framework
Verilog
C# 3.0
Amazon Ec2
Tinymce
Serial Port
Oracle Apex
Git
Ios6
Jquery Ui
Google Compute Engine
Dialogflow Es
Sass
Centos
Seo
Gruntjs
Telerik
Process
Visual Studio 2017
Sql Server
Nlp
Devexpress
React Native
Ssh
Air
Windows Phone 7
Apache Flink
Jenkins
Flask
Tcl
Javascript
Safari
Osgi
Cucumber
Silverlight
Scripting
Calendar
Rabbitmq
Xampp
Pandas
Nservicebus
Url
Css
Google Sheets
Properties
Robotframework
Doctrine Orm
Virtualbox
Scikit Learn
EmptyTag
Ipad
Titanium
Cakephp
Apache
Methods
Ibm Midrange
Sphinx
Memory
Jdbc
Ruby On Rails 3.2
Spring Integration


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网