Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/algorithm/12.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Algorithm 扩展布尔模型解释?_Algorithm - Fatal编程技术网

Algorithm 扩展布尔模型解释?

Algorithm 扩展布尔模型解释?,algorithm,Algorithm,我们正在实现扩展布尔模型,但我们无法确定如何使用给定的公式:此处的公式: 包含三个“变量”,但我们不知道它们的含义。假设我们已经处理了文档集合,所以我们已经映射了集合中的所有单词,对于每个术语,我们有每个文档中的占用计数以及整个集合中的发生计数(具体术语)。我在这里说“与文档dj相关的术语Kx的权重” 所以我们讨论的是术语“x”和文档“j”i’是使Idfi(频率最高的术语)最大化的值。因此,以下是对我有意义的内容:x是语料库中所有唯一术语/单词的计数器,j是所有文档的计数器。分母max_i(i

我们正在实现扩展布尔模型,但我们无法确定如何使用给定的公式:此处的公式:

包含三个“变量”,但我们不知道它们的含义。假设我们已经处理了文档集合,所以我们已经映射了集合中的所有单词,对于每个术语,我们有每个文档中的占用计数以及整个集合中的发生计数(具体术语)。

我在这里说“与文档dj相关的术语Kx的权重”


所以我们讨论的是术语“x”和文档“j”i’是使Idfi(频率最高的术语)最大化的值。

因此,以下是对我有意义的内容:x是语料库中所有唯一术语/单词的计数器,j是所有文档的计数器。分母max_i(i df_i)是为所有文档计算一次的最大IDF值,用于标准化。这样,w_x(x,j)是特定文档中特定单词的权重,计算为该文档中该单词的频率与该单词的标准化IDF的乘积。