Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/algorithm/11.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Algorithm 信息检索概率模型_Algorithm_Nlp_Information Retrieval - Fatal编程技术网

Algorithm 信息检索概率模型

Algorithm 信息检索概率模型,algorithm,nlp,information-retrieval,Algorithm,Nlp,Information Retrieval,你知道我在哪里可以找到源代码(任何语言)来编程基于概率模型的信息检索系统吗 我试图在网上搜索它,发现了一个名为bm25或bmf25的算法,但我不知道它是否有用 基本上,我试图比较3种IR算法的性能:向量空间模型、布尔模型和概率模型。现在我已经找到了向量空间和布尔模型。根据结果,我们需要使用其中最好的方法来开发问答系统 提前感谢如果您正在寻找已实施BM25的红外引擎,您可以尝试 语言是Java。您可以使用引擎本身,也可以查看BM25或其他术语权重模型实现的源代码。这里的混淆在于存在几种概率IR模型

你知道我在哪里可以找到源代码(任何语言)来编程基于概率模型的信息检索系统吗

我试图在网上搜索它,发现了一个名为bm25或bmf25的算法,但我不知道它是否有用

基本上,我试图比较3种IR算法的性能:向量空间模型、布尔模型和概率模型。现在我已经找到了向量空间和布尔模型。根据结果,我们需要使用其中最好的方法来开发问答系统


提前感谢

如果您正在寻找已实施BM25的红外引擎,您可以尝试


语言是Java。您可以使用引擎本身,也可以查看BM25或其他术语权重模型实现的源代码。

这里的混淆在于存在几种概率IR模型(例如2-Poisson、二进制独立模型、语言建模变体),因此问题是不明确的。但根据我的经验,当人们说“概率模型”时,他们通常指的是由罗伯逊和斯帕奇·琼斯提出的二进制独立模型的一些变体。BM25(相当粗略地)近似于这个模型,这就是我在本例中使用的。狐猴工具包中包含BM25的规范实现。见:


嗨!信息检索是一个完整的领域!还有许多概率模型。如果你能具体说明你想做什么,你已经尝试过什么(你提到过),还有什么不奏效,这肯定会对我们有所帮助。对于一般IR,我从这里开始:我试图比较3种IR算法的性能:向量空间模型、布尔模型和概率模型。现在我已经找到了向量空间和布尔模型。根据结果,我们需要使用其中最好的来开发问答系统。请使用此信息更新您的问题!