Java web收获-抓取url_Java_Eclipse_Web_Web Scraping_Webharvest - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/kubernetes/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java web收获-抓取url_Java_Eclipse_Web_Web Scraping_Webharvest - Fatal编程技术网

Java web收获-抓取url

java eclipse web web-scraping

Java web收获-抓取url,java,eclipse,web,web-scraping,webharvest,Java,Eclipse,Web,Web Scraping,Webharvest,我正在使用WebHarvest。但是，我想从URL中提取数据：我的代码是： <?xml version="1.0" encoding="UTF-8"?> <config> <var-def name="google"> <html-to-xml> <http url="http://derstandard.at/anzeiger/immoweb

我正在使用WebHarvest。但是，我想从URL中提取数据：

我的代码是：

<?xml version="1.0" encoding="UTF-8"?>

<config>
    <var-def name="google">
    <html-to-xml>
    <http url="http://derstandard.at/anzeiger/immoweb/Suchergebnis.aspx?Regionen=9&Bezirke=&Arten=&AngebotTyp=&timestamp=1363305908912"></http>
    </html-to-xml>
    </var-def>
</config>

然而，我得到：

对实体Bezirke的引用必须以“；”结尾

我不明白带“；”的网络收获是什么意思

我对网络收获知之甚少，但他们的例子有：

<xpath expression="//a[@shape='rect']/@href">
    <html-to-xml>
        <http url="http://www.somesite.com/"/>
    </html-to-xml>
</xpath>

<http url =".." />

而您的代码

<http url = ".."></http>

也许这是你的问题？不需要结束标记

您应该在url中编码ampresands，即使用

&；更改每个和
我不确定您将如何获取web，但我建议您使用Jsoup。这真的很简单而且有用。




[eclipse]相关文章推荐



                                                        
安装Eclipse
eclipseinstallationeclipse-rcp 
如何在eclipse中插入特定于平台的代码？
eclipseplugins 
Zend Studio/Eclipse仅使用Firefox进行调试
eclipsebrowser 
从命令行安装Maven但从EclipseUI传递的测试失败
eclipsemaveneclipse-plugin 
Eclipse 相当于Komodo'；s"；“显示未保存的更改”；在阿普塔纳工作室？
eclipse 
WSO2 ESB Eclipse插件
eclipsepluginswso2 
Eclipse：在Project Explorer中搜索文件夹和资源
eclipseeclipse-plugin 
无法在Eclipse中运行Erlang
eclipseerlang 
Eclipse Google AppEngine开发服务器参数
eclipsegwt 
Eclipse jena例外初始化错误
eclipseexception 
Eclipse未启动
eclipse 
Eclipse Tomcat无法加载Bean类
eclipsetomcat 
Eclipse 种类之间的区别是什么；con"；和种类；src"；内部构建路径引用
eclipse 
eclipse完全隐藏一个项目，不进行处理
eclipse 
Eclipse jar在运行时不可用，为什么不可用？
eclipsespringmavenspring-mvctomcat 
代码无法识别的eclipse工作区
eclipse 
Eclipse 使用ApacheTika提取pdf文件的特定字段值
eclipse 
通过cli安装Eclipse插件需要10分钟
eclipseeclipse-plugin 
Eclipse WSO2在helios中安装developer studio的问题
eclipseeclipse-pluginwso2 
Eclipse、IntelliJ IDEA或WebStorm中Nightwatch.js的代码完成
eclipseintellij-ideawebstorm 
                                       





随机文章推荐


                                        

                                        
                                        


                                                
                                                        [java]相关推荐
                                                        
REST POST to Java应用程序返回JSON响应，其中一些字段为空
									Java
							 									Json
							 									Mongodb
							 									Spring Boot
							 									Postman
							 
在javaFx中创建对象的类中，为另一个类（视为组件）的对象内部的组件创建操作事件？
									Java
							 									Object
							 									Javafx
							 									Javafx 2
							 
如何在Java中尽可能快地模拟鼠标点击？
									Java
							 
使用JavaSwing和鼠标事件方法绘制二叉树
									Java
							 									Swing
							 									Netbeans
							 
Java Jenkins maven作业错误：AntClassLoader
									Java
							 									Maven
							 									Jenkins
							 									Ant
							 
如何使用Java反射调用Android Dalvik内部方法？
									Java
							 									Android
							 									Eclipse
							 									Reflection
							 
“线程中的异常”；“主线程”；NoClassDefFoundError:javax/crypto/SunJCE_b
									Java
							 									Web Services
							 									Ssl
							 
Java 使用jdbc到neo4j服务器连接提高cypher查询性能并发现cypher中的瓶颈
									Java
							 									Jdbc
							 									Neo4j
							 
Java Hibernate@公式减法和加法
									Java
							 									Sql
							 									Hibernate
							 									Postgresql
							 
Java 无法在android studio中显示来自后台服务的通知
									Java
							 									Android
							 									Android Studio
							 
Java 如何创建一个基本的；“创建.gradle”；文件
									Java
							 									Android
							 									Opencv
							 									Android Studio
							 
如何将数字转换为其2'；java中的赞美语
									Java
							 
Java 从和Android应用程序向Google电子表格发送数据
									Java
							 									Android
							 									Android Studio
							 									Google Sheets
							 
Java OpenCV Android转换c++；到爪哇
									Java
							 									Android
							 									C++
							 									Opencv
							 									Image Processing
							 
Java 在这里失踪？任何提示都非常欢迎，谢谢
import android.app.ListActivity;
import android.content.DialogInterface;
import android.database.Cursor;
impo
									Java
							 									Android
							 									Sqlite
							 									Listview
							 
使用粘贴时EditText崩溃：致命异常：java.lang.IndexOutOfBoundsException:98，-81
									Java
							 									Android
							 
build impl.xml:1050:运行JavaSpringWeb项目时出现模块尚未部署错误+；网虫
									Java
							 									Xml
							 									Spring Mvc
							 									Netbeans
							 
Java Reddit api请求403错误
									Java
							 									Android
							 
在java中建模加载的数据
									Java
							 
Java Android文件存储存储内存位置
									Java
							 									Android
							 									File
							 									Hash
							 
Java 图结构的深度复制
									Java
							 									Data Structures
							 
Java 如何用J-unit测试简单的if-else语句？
									Java
							 									Testing
							 
Java 错误：无法找到或加载主类schemacrawler.main
									Java
							 									Shell
							 									Jar
							 
Java Mockito/PowerMock：静态初始化被抑制时类的Mock静态字段
									Java
							 									Junit
							 
Java 单击Imageview并在新活动中打开全屏图像
									Java
							 									Android
							 
Java 在Kali Linux中，NetBeans无法从终端或GUI启动
									Java
							 									Linux
							 									Eclipse
							 									Netbeans
							 									Java 8
							 
Java 打印特定字符
									Java
							 									String
							 									For Loop
							 									Input
							 
Java PlayFramework应用ClassLoader的演变
									Java
							 									Playframework
							 
重构Java代码以使其可重用
									Java
							 
Java 将LocalDateTime转换为偏移量为0的日期
									Java
							 									Date
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Service
Notifications
Mapreduce
Raspberry Pi
Class
Ag Grid
Webrtc
Ocaml
Pyspark
Eclipse Rcp
Scheme
Uml
Cucumber
Network Programming
Soap
Deep Learning
Exception Handling
Go
Internet Explorer 8
Windows Phone
Nuget
Windows Phone 7
Sharepoint
Memory Leaks
Embedded
File
Rdf
Deployment
Biztalk
F#
Pytorch
Editor
Codenameone
Openshift
Corda
Google Cloud Dataflow
Amp Html
Terminal
Asp.net Mvc 4
Kotlin
Image
Gitlab
Vue.js
Utf 8
Opencart
Django
Qt4
Blackberry
Svg
Three.js
List
Core Data
Database Design
Opencv
Postgresql
Jquery Ui
Dependency Injection
Ipython
Wcf
Asp.net Mvc
Rx Java
Google Chrome Devtools
Google Analytics
Uitableview
Intellij Idea
Cocos2d X
Racket
Google App Maker
Computer Vision
Api
Bots
Validation
Sbt
Php
Scikit Learn
Redis
C# 4.0
Selenium
Octave
Karate
Phantomjs
Video Streaming
Directory
Entity Framework 4
Stream
Apache Flink
Entity Framework Core
Browser
Asp.net Mvc 3
Appium
Logging
C#
Mobile
Android Emulator
Navigation
Salesforce
Hybris
Crystal Reports
Filter
Networking
Ftp
Mono
Sapui5
Windows Store Apps
Machine Learning
Razor
Windows
Udp
Interface
Google Sheets
Amazon Dynamodb
Unix
Variables
Mvvm
Windows Services
Dll
Jetty
Stata
Scala
Liferay
Jaxb
Datatables
Google Apps Script
Ruby On Rails 3.1
Parse Platform
Hibernate
Stored Procedures
Coq
Stanford Nlp
Google Api
Routing
Single Sign On
Web
Gis
Less
Antlr
Module
Cloud Foundry
Quickbooks
Twilio
Nginx
Angular Material
Express
String
Flask
Logic
Spring Cloud
Android Ndk
Curl
Woocommerce
Sap
Gwt
Android Fragments
Dynamic
Asp Classic
Tomcat
Laravel 5
D
Jenkins
Ada
Sugarcrm
Winforms
Cakephp
Asynchronous
Wso2
Xamarin.android
Linux
Charts
Ssis
Tcl
Functional Programming
Design Patterns
Debian
Javascript
.htaccess
Matrix
Kentico
Calendar
Parallel Processing
Electron
Playframework
Memory
Meteor
Moodle
Titanium
Zend Framework
Vhdl
Azure Data Factory
Webview
Macos
Akka
Ms Access
Gtk
Join
Ionic2
Azure Functions
Http
Vmware
Junit
Dictionary
Jestjs


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网