Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/69.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 解析HTML内容以存储有用信息_Java_Html - Fatal编程技术网

Java 解析HTML内容以存储有用信息

Java 解析HTML内容以存储有用信息,java,html,Java,Html,我使用下面的代码片段获取基于URL和一些参数的网页 URL url = new URL("http://location.com"); HttpURLConnection cn= (HttpURLConnection)url.openConnection(); ... Reader in = new BufferedReader(new InputStreamReader(cn.getInputStream(), "UTF-8")); 然后我将在中迭代,以打印字符。这将打印原始数据。我正在寻找

我使用下面的代码片段获取基于URL和一些参数的网页

URL url = new URL("http://location.com");
HttpURLConnection cn= (HttpURLConnection)url.openConnection();
...
Reader in = new BufferedReader(new InputStreamReader(cn.getInputStream(), "UTF-8"));
然后我将在中迭代
,以打印字符。这将打印原始数据。我正在寻找一个HTML解析器,它可以创建

Choose the method:<br><input type="radio" name="id_radio" value="345425" onClick="setTrans()">
            <A HREF="http://server.com/view?db=mirror;trans=345425" TARGET="_new">345425</A> (<i>encoding</i>, 5239 bases)
&nbsp;&nbsp;&nbsp;<A HREF="http://somewhere/M_08076559" TARGET="_new">M_08076559</A>
选择方法:
(编码,5239个碱基)

然后我想提取
,即
345425
编码
和其他内容。我看到一些第三方解析器(例如),但我没有尝试,因为1)不知道它们是否适合我的需要,2)是否有标准的java api/包来避免第三方代码。那么,对此有什么评论吗?

您可以这样看java dom解析器查看文档,它将完成从发送请求到接收响应和格式化数据的所有工作。我说得对吗?这样,就不需要使用
HttpURLConnection
BufferedReader
和。。。你同意吗?是的,就是这样;)那么,我应该删除这个帖子吗?我知道答案了!谢谢,你可以根据自己的喜好在自己的帖子中添加答案