Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/359.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 解析XML提要_Java_Solr_Lucene_Xml Parsing_Nutch - Fatal编程技术网

Java 解析XML提要

Java 解析XML提要,java,solr,lucene,xml-parsing,nutch,Java,Solr,Lucene,Xml Parsing,Nutch,我想解析站点的RSS提要,获取内容(例如文章),并将其放入数据库。稍后,我还想根据搜索关键字为它们编制索引。谁能告诉我怎么做?什么工具最适合用于此? 我搜索了ApacheLucene、solr和ApacheNutch。但我仍然不清楚如何用java等编程语言实现它。 任何人都可以提供更多关于实施的细节 提前谢谢。首先,我要通读一遍 接下来,我将熟悉一些网络API 特别是, (注意,这可能有点进步,但我发现它很有用) 我也已经熟悉了,这对查找您感兴趣的文档部分很有用 下一步,我会成为 这应该包括

我想解析站点的RSS提要,获取内容(例如文章),并将其放入数据库。稍后,我还想根据搜索关键字为它们编制索引。谁能告诉我怎么做?什么工具最适合用于此? 我搜索了ApacheLucene、solr和ApacheNutch。但我仍然不清楚如何用java等编程语言实现它。 任何人都可以提供更多关于实施的细节


提前谢谢。

首先,我要通读一遍

接下来,我将熟悉一些网络API

  • 特别是,
  • (注意,这可能有点进步,但我发现它很有用)
我也已经熟悉了,这对查找您感兴趣的文档部分很有用

下一步,我会成为

这应该包括基本的内容

一旦你对这些技术有了一个基本的想法,你就需要考虑一下设计。我将it元素分离到它自己的项目中

将数据作为一个项目进行下载、解析、排序和插入数据库

处理在另一个数据库中的搜索和检索


这将突出显示重叠区域,并向您显示需要提供公共库的位置。

谢谢您的回复。我正在调查你提到的链接。