Java 从rss读取url_Java_Xml - Fatal编程技术网

Java 从rss读取url

java xml

Java 从rss读取url,java,xml,Java,Xml,我正在尝试从rss读取url <story> <title> http://www.someurl.com//modules.php?name=News&file=article&sid=622 </title> </story> 但我只得到：在标题var中有什么问题吗？为什么不试试像这样的提要解析器呢。您确定在原始RSS中转义了与符吗？因为如果不是的话，那正是我所期望的。我正在用一个HTTPRequest获取rssFeed

我正在尝试从rss读取url

<story>
<title>
 http://www.someurl.com//modules.php?name=News&file=article&sid=622
</title>
</story>

但我只得到：在标题var中

有什么问题吗？

为什么不试试像这样的

提要解析器呢。您确定在原始RSS中转义了与符吗？因为如果不是的话，那正是我所期望的。我正在用一个HTTPRequest获取rssFeed。。所以我有,；在url中（当我在页面上单击“查看源代码”时，我会看到它）。。但是这与没有在“title”变量中获取完整url有关吗？有三种可能性：（1）输入数据被破坏，（2）检索值的代码被破坏，或者（3）XML解析器被破坏。您的代码看起来还不错（尽管以您这样的方式在DOM中运行是相当脆弱的），而且我不相信解析器（每天有1000多人使用）是坏的。这就剩下XML了。此外，解析器丢弃无效标记后的内容并使用元素结束标记重新拾取（尽管抛出更合理）是合理的行为。至于“查看源代码”：浏览器因纠正错误内容而臭名昭著（这是Postel定律）。我要么（1）转储实际的InputStream，要么（2）使用诸如curl或wget之类的工具来检索原始内容。
StringReader rssFeedStringReader = new StringReader(rssFeed);
InputSource inputSource = new InputSource(rssFeedStringReader);  
DocumentBuilder builder = factory.newDocumentBuilder();
Document document =  builder.parse(inputSource);
articleNodes = (NodeList)expr.evaluate(document, XPathConstants.NODESET);
Node articleNode = articleNodes.item(i).getFirstChild();
Node articleTitle = articleNode.getFirstChild();
String title = articleTitle.getNodeValue();