Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在Azure和Lucene.NET上构建分布式索引。我应该学习Solr和Hadoop吗?_Lucene_Solr_Lucene.net_Azure Storage Blobs - Fatal编程技术网

在Azure和Lucene.NET上构建分布式索引。我应该学习Solr和Hadoop吗?

在Azure和Lucene.NET上构建分布式索引。我应该学习Solr和Hadoop吗?,lucene,solr,lucene.net,azure-storage-blobs,Lucene,Solr,Lucene.net,Azure Storage Blobs,我需要有基于Azure/Lucene.NET实现的搜索索引。话虽如此,我对Solr和Hadoop以及它们为Linux用户提供的东西知之甚少 因为我不知道未来的学习曲线,我会告诉你我在寻找什么,也许你可以告诉我应该如何度过我的时间 我对我们系统中不断增长的一批电子邮件的索引很感兴趣。在发送或接收消息时,需要对其进行搜索。这意味着索引可能会变得巨大,这就是我们关注云存储的原因。考虑到我熟悉Azure,管理层建议我们使用Lucene.NET 你认为我花时间的最佳方式是什么:研究如何让Lucene.NE

我需要有基于Azure/Lucene.NET实现的搜索索引。话虽如此,我对Solr和Hadoop以及它们为Linux用户提供的东西知之甚少

因为我不知道未来的学习曲线,我会告诉你我在寻找什么,也许你可以告诉我应该如何度过我的时间

我对我们系统中不断增长的一批电子邮件的索引很感兴趣。在发送或接收消息时,需要对其进行搜索。这意味着索引可能会变得巨大,这就是我们关注云存储的原因。考虑到我熟悉Azure,管理层建议我们使用Lucene.NET


你认为我花时间的最佳方式是什么:研究如何让Lucene.NET为我的文档编制索引,或者研究Solr/Hadoop的实现。

如果不知道源语料库的规模(我们在一个近乎实时的应用程序中操作数TB),我可以分享一些经验。我们主要是一家.NET商店,我们发现使用Solr非常容易,使用SolrNet等工具和我们的开发人员非常容易的学习曲线

使用Solr的优点很多:从明显的方面来说,比如刻面,一个简单、灵活的API,如果你需要的话,等等。;事实上,它拥有更活跃的社区,拥有最新和最强大的功能和补丁(参见Lucene.net)。重要的是,我们可以轻松地将Solr与商品机器进行线性扩展(很抱歉,无法与使用云进行美元比较),但考虑到我们用于碎片的机器的成本(几乎为零),我无法想象使用Azure或AWS会更便宜


希望能有所帮助。

如果您可以通过HTTP与索引机通信,我建议您使用Solr。只需更改配置文件,无需任何编程即可轻松设置Solr服务器。它可以很好地扩展,请参见:。目前正在开发的是,这将使扩展Solr变得更容易,并支持一些类似hadoop的功能。

如果有人需要知道“cf”是什么意思(我只是查了一下):。