Java 解析HTML内容以存储有用信息
我使用下面的代码片段获取基于URL和一些参数的网页Java 解析HTML内容以存储有用信息,java,html,Java,Html,我使用下面的代码片段获取基于URL和一些参数的网页 URL url = new URL("http://location.com"); HttpURLConnection cn= (HttpURLConnection)url.openConnection(); ... Reader in = new BufferedReader(new InputStreamReader(cn.getInputStream(), "UTF-8")); 然后我将在中迭代,以打印字符。这将打印原始数据。我正在寻找
URL url = new URL("http://location.com");
HttpURLConnection cn= (HttpURLConnection)url.openConnection();
...
Reader in = new BufferedReader(new InputStreamReader(cn.getInputStream(), "UTF-8"));
然后我将在中迭代,以打印字符。这将打印原始数据。我正在寻找一个HTML解析器,它可以创建
Choose the method:<br><input type="radio" name="id_radio" value="345425" onClick="setTrans()">
<A HREF="http://server.com/view?db=mirror;trans=345425" TARGET="_new">345425</A> (<i>encoding</i>, 5239 bases)
<A HREF="http://somewhere/M_08076559" TARGET="_new">M_08076559</A>
选择方法:
(编码,5239个碱基)
然后我想提取值
,即345425
,编码
和其他内容。我看到一些第三方解析器(例如),但我没有尝试,因为1)不知道它们是否适合我的需要,2)是否有标准的java api/包来避免第三方代码。那么,对此有什么评论吗?您可以这样看java dom解析器查看文档,它将完成从发送请求到接收响应和格式化数据的所有工作。我说得对吗?这样,就不需要使用HttpURLConnection
、BufferedReader
和。。。你同意吗?是的,就是这样;)那么,我应该删除这个帖子吗?我知道答案了!谢谢,你可以根据自己的喜好在自己的帖子中添加答案