Mongodb PPDB准相位搜索

Mongodb PPDB准相位搜索,mongodb,nlp,bigdata,database,Mongodb,Nlp,Bigdata,Database,有一个众所周知的释义词汇资源 它有几种形式,从最大的精确性到最大的召回率。最大的释义集XXXL包含约5Gb的数据 我希望PPDB用于我的研究,我想知道在这么大的资源中执行搜索的最佳引擎是什么。我没有试过,但我认为按文件的原样使用它不是一个好主意 我曾考虑将所有数据导出到mongo,但我不确定这是否是最佳解决方案 如果您有一些想法,请与我们分享 谢谢。 你需要考虑以下几个方面: 1.对于您的用例,您将需要一个无模式的数据库 2.不需要交易记录 3.快速查询/搜索 4.易于安装和部署 5.处理大量数

有一个众所周知的释义词汇资源

它有几种形式,从最大的精确性到最大的召回率。最大的释义集XXXL包含约5Gb的数据

我希望PPDB用于我的研究,我想知道在这么大的资源中执行搜索的最佳引擎是什么。我没有试过,但我认为按文件的原样使用它不是一个好主意

我曾考虑将所有数据导出到mongo,但我不确定这是否是最佳解决方案

如果您有一些想法,请与我们分享


谢谢。

你需要考虑以下几个方面: 1.对于您的用例,您将需要一个无模式的数据库 2.不需要交易记录 3.快速查询/搜索 4.易于安装和部署 5.处理大量数据的能力

以上各方面均表明采用MongoDB。
但将数据导出到MongoDB在初期会遇到麻烦,但这绝对是值得的。对于每个文档,您的数据模型可以如下{key:[value1,value2,…]}

你能给我们一些更多的信息吗?为什么你想使用MongoDB???@vmr,我想将数据导出到mongo,然后我想运行查询,搜索paraphases,等等。