Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/393.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 如何在Textpad中使用Html解析器?_Java_Html_Parsing_Classpath_Textpad - Fatal编程技术网

Java 如何在Textpad中使用Html解析器?

Java 如何在Textpad中使用Html解析器?,java,html,parsing,classpath,textpad,Java,Html,Parsing,Classpath,Textpad,我并不是Java的新手,我在大学里学过Java。我目前正在做一个从网上网页抓取数据的小程序。我做谷歌搜索,发现html解析器是一种简单的方法 我的问题是如何设置类路径,并在TextPad中导入html解析器库 ------我的回答----------------------------------------------- 我找到了解决这个问题的办法。我想我应该把它贴到这里,以防别人和我有同样的问题 我不知道这是不是解决这个问题的合适方法。给你 我找到了一个链接 我下载了htmlparser

我并不是Java的新手,我在大学里学过Java。我目前正在做一个从网上网页抓取数据的小程序。我做谷歌搜索,发现html解析器是一种简单的方法

我的问题是如何设置类路径,并在TextPad中导入html解析器库

------我的回答-----------------------------------------------

我找到了解决这个问题的办法。我想我应该把它贴到这里,以防别人和我有同样的问题

我不知道这是不是解决这个问题的合适方法。给你

我找到了一个链接

我下载了htmlparser zip文件,并将lib文件夹解压缩到我的c驱动器中。 我在CMD中运行这一行。(我使用的是基于windows的系统。) 设置CLASSPATH=C:\lib\htmlparser.jar;C:\lib\htmlexer.jar;%类路径% 然后它就起作用了


我猜这一行是为了将新的.jar文件添加到旧的类路径中CLASSPATH%表示您的旧类路径。

我做了大量的屏幕清理,发现Java太麻烦了。根据我的经验,我宁愿使用Groovy来筛选数据。你不需要去摆弄讨厌的类路径。因为groovy是一个面向Java的dsl,您知道Java,所以它将非常简单。您还可以将Textpad用作编辑器

例如:

def slurper = new XmlSlurper()
def htmlParser = slurper.parse("http://stackoverflow.com")

htmlParser.'**'.findAll{ it.@class == 'question-hyperlink'}.each {
   println it
}

以上代码来自一篇博文:

谢谢您的建议。但我不知道Groovy。我读了你在回复中发布的博客。我不知道。你能给我写个样品吗?非常感谢。