Java 如何在Textpad中使用Html解析器?
我并不是Java的新手,我在大学里学过Java。我目前正在做一个从网上网页抓取数据的小程序。我做谷歌搜索,发现html解析器是一种简单的方法 我的问题是如何设置类路径,并在TextPad中导入html解析器库 ------我的回答----------------------------------------------- 我找到了解决这个问题的办法。我想我应该把它贴到这里,以防别人和我有同样的问题 我不知道这是不是解决这个问题的合适方法。给你 我找到了一个链接 我下载了htmlparser zip文件,并将lib文件夹解压缩到我的c驱动器中。 我在CMD中运行这一行。(我使用的是基于windows的系统。) 设置CLASSPATH=C:\lib\htmlparser.jar;C:\lib\htmlexer.jar;%类路径% 然后它就起作用了Java 如何在Textpad中使用Html解析器?,java,html,parsing,classpath,textpad,Java,Html,Parsing,Classpath,Textpad,我并不是Java的新手,我在大学里学过Java。我目前正在做一个从网上网页抓取数据的小程序。我做谷歌搜索,发现html解析器是一种简单的方法 我的问题是如何设置类路径,并在TextPad中导入html解析器库 ------我的回答----------------------------------------------- 我找到了解决这个问题的办法。我想我应该把它贴到这里,以防别人和我有同样的问题 我不知道这是不是解决这个问题的合适方法。给你 我找到了一个链接 我下载了htmlparser
我猜这一行是为了将新的.jar文件添加到旧的类路径中CLASSPATH%表示您的旧类路径。我做了大量的屏幕清理,发现Java太麻烦了。根据我的经验,我宁愿使用Groovy来筛选数据。你不需要去摆弄讨厌的类路径。因为groovy是一个面向Java的dsl,您知道Java,所以它将非常简单。您还可以将Textpad用作编辑器 例如:
def slurper = new XmlSlurper()
def htmlParser = slurper.parse("http://stackoverflow.com")
htmlParser.'**'.findAll{ it.@class == 'question-hyperlink'}.each {
println it
}
以上代码来自一篇博文:谢谢您的建议。但我不知道Groovy。我读了你在回复中发布的博客。我不知道。你能给我写个样品吗?非常感谢。