Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Hadoop的特别报告_Hadoop_Reporting - Fatal编程技术网

Hadoop的特别报告

Hadoop的特别报告,hadoop,reporting,Hadoop,Reporting,我想让人们输入简单的文本搜索词,运行pig作业(如果这是最好的?这是我最了解的),并输出结果(tsv文件结果?),这样我就可以在web界面上显示它们 有什么办法解决这个问题吗? 有并没有什么已知的东西能将我要寻找的几个不连贯的流程连接在一起 谢谢为什么不将文档索引到Lucene或Solr中?然后你就可以实时搜索文本了。Hadoop是为面向批处理的流程而设计的,在本例中,这似乎不是您想要的。为什么不将文档索引到Lucene或Solr中?然后你就可以实时搜索文本了。Hadoop是为面向批处理的过程而

我想让人们输入简单的文本搜索词,运行pig作业(如果这是最好的?这是我最了解的),并输出结果(tsv文件结果?),这样我就可以在web界面上显示它们

有什么办法解决这个问题吗?
有并没有什么已知的东西能将我要寻找的几个不连贯的流程连接在一起


谢谢

为什么不将文档索引到Lucene或Solr中?然后你就可以实时搜索文本了。Hadoop是为面向批处理的流程而设计的,在本例中,这似乎不是您想要的。

为什么不将文档索引到Lucene或Solr中?然后你就可以实时搜索文本了。Hadoop是为面向批处理的过程而设计的,在本例中,这似乎不是您想要的。

好吧,这取决于您的项目需求。它需要低延迟吗?特别搜索有多复杂。我认为hbase+pig可能是一个综合解决方案。hbase可以用于搜索实时搜索目的(尽管其搜索功能不如RDBMS强大),也可以用于批量处理大量数据。

这取决于您的项目要求。它需要低延迟吗?特别搜索有多复杂。我认为hbase+pig可能是一个综合解决方案。hbase可用于搜索实时搜索目的(尽管其搜索功能不如RDBMS强大),而pig可用于批量处理大量数据。

从未进行过solr索引。我想概念验证是我要做的第一步,实现Solr/Lucene索引可能比我要做的更具开创性。真的吗?在POC中使用Solr可能比在Hadoop中使用它本来不打算做的事情更容易。从来没有做过Solr索引。我想概念验证是我要做的第一步,实现Solr/Lucene索引可能比我要做的更具开创性。真的吗?将Solr用于POC可能比将Hadoop用于它原本不打算做的事情更容易。