Java 从rss读取url
我正在尝试从rss读取urlJava 从rss读取url,java,xml,Java,Xml,我正在尝试从rss读取url <story> <title> http://www.someurl.com//modules.php?name=News&file=article&sid=622 </title> </story> 但我只得到: 在标题var中 有什么问题吗?为什么不试试像这样的提要解析器呢。您确定在原始RSS中转义了与符吗?因为如果不是的话,那正是我所期望的。我正在用一个HTTPRequest获取rssFeed
<story>
<title>
http://www.someurl.com//modules.php?name=News&file=article&sid=622
</title>
</story>
但我只得到:
在标题var中
有什么问题吗?为什么不试试像这样的
提要解析器呢。您确定在原始RSS中转义了与符吗?因为如果不是的话,那正是我所期望的。我正在用一个HTTPRequest获取rssFeed。。所以我有,;在url中(当我在页面上单击“查看源代码”时,我会看到它)。。但是这与没有在“title”变量中获取完整url有关吗?有三种可能性:(1)输入数据被破坏,(2)检索值的代码被破坏,或者(3)XML解析器被破坏。您的代码看起来还不错(尽管以您这样的方式在DOM中运行是相当脆弱的),而且我不相信解析器(每天有1000多人使用)是坏的。这就剩下XML了。此外,解析器丢弃无效标记后的内容并使用元素结束标记重新拾取(尽管抛出更合理)是合理的行为。至于“查看源代码”:浏览器因纠正错误内容而臭名昭著(这是Postel定律)。我要么(1)转储实际的InputStream,要么(2)使用诸如curl或wget之类的工具来检索原始内容。
StringReader rssFeedStringReader = new StringReader(rssFeed);
InputSource inputSource = new InputSource(rssFeedStringReader);
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(inputSource);
articleNodes = (NodeList)expr.evaluate(document, XPathConstants.NODESET);
Node articleNode = articleNodes.item(i).getFirstChild();
Node articleTitle = articleNode.getFirstChild();
String title = articleTitle.getNodeValue();