Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/400.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 从rss读取url_Java_Xml - Fatal编程技术网

Java 从rss读取url

Java 从rss读取url,java,xml,Java,Xml,我正在尝试从rss读取url <story> <title> http://www.someurl.com//modules.php?name=News&file=article&sid=622 </title> </story> 但我只得到: 在标题var中 有什么问题吗?为什么不试试像这样的提要解析器呢。您确定在原始RSS中转义了与符吗?因为如果不是的话,那正是我所期望的。我正在用一个HTTPRequest获取rssFeed

我正在尝试从rss读取url

<story>
<title>
 http://www.someurl.com//modules.php?name=News&file=article&sid=622
</title>
</story>
但我只得到: 在标题var中


有什么问题吗?

为什么不试试像这样的
提要解析器呢。您确定在原始RSS中转义了与符吗?因为如果不是的话,那正是我所期望的。我正在用一个HTTPRequest获取rssFeed。。所以我有,;在url中(当我在页面上单击“查看源代码”时,我会看到它)。。但是这与没有在“title”变量中获取完整url有关吗?有三种可能性:(1)输入数据被破坏,(2)检索值的代码被破坏,或者(3)XML解析器被破坏。您的代码看起来还不错(尽管以您这样的方式在DOM中运行是相当脆弱的),而且我不相信解析器(每天有1000多人使用)是坏的。这就剩下XML了。此外,解析器丢弃无效标记后的内容并使用元素结束标记重新拾取(尽管抛出更合理)是合理的行为。至于“查看源代码”:浏览器因纠正错误内容而臭名昭著(这是Postel定律)。我要么(1)转储实际的InputStream,要么(2)使用诸如curl或wget之类的工具来检索原始内容。
StringReader rssFeedStringReader = new StringReader(rssFeed);
InputSource inputSource = new InputSource(rssFeedStringReader);  
DocumentBuilder builder = factory.newDocumentBuilder();
Document document =  builder.parse(inputSource);
articleNodes = (NodeList)expr.evaluate(document, XPathConstants.NODESET);
Node articleNode = articleNodes.item(i).getFirstChild();
Node articleTitle = articleNode.getFirstChild();
String title = articleTitle.getNodeValue();