Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/algorithm/12.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Algorithm 描述马尔可夫判别算法的公式理解困难_Algorithm_Math_Spam Prevention_Discrete Mathematics - Fatal编程技术网

Algorithm 描述马尔可夫判别算法的公式理解困难

Algorithm 描述马尔可夫判别算法的公式理解困难,algorithm,math,spam-prevention,discrete-mathematics,Algorithm,Math,Spam Prevention,Discrete Mathematics,我已经仔细研究了这篇论文()好几天了,但是还没有理解第3节或之后的任何公式 特别是,我不理解这些部分的含义: p(w | C(w)=s) /* 文档是垃圾邮件的概率取决于文档中的给定单词是否为垃圾邮件? */ p(w | C(w)=垃圾邮件) /* 这个概率和前面的表达式一样吗?为什么是“垃圾邮件”而不是“s”,反之亦然? */ {带下标“团c”}的乘积运算符({带下标c}(w,spam)的乘积运算符)) /* 在本文中,最里面的表达式据说是指局部概率,但我不理解它的表示法。产品操作符后面的(w

我已经仔细研究了这篇论文()好几天了,但是还没有理解第3节或之后的任何公式

特别是,我不理解这些部分的含义:

p(w | C(w)=s) /* 文档是垃圾邮件的概率取决于文档中的给定单词是否为垃圾邮件? */

p(w | C(w)=垃圾邮件) /* 这个概率和前面的表达式一样吗?为什么是“垃圾邮件”而不是“s”,反之亦然? */

{带下标“团c”}的乘积运算符({带下标c}(w,spam)的乘积运算符))

/* 在本文中,最里面的表达式据说是指局部概率,但我不理解它的表示法。产品操作符后面的(w,spam)是有序集还是函数?它的功能是什么? */


我也不理解任何带有二项式系数的公式,但对于那些公式,至少我认为我知道我应该开始读什么。

关于前两个,第一个对我来说就像它是s中s的变量。
s
。第二个只讨论C(w)=spam,在哪些情况下s=垃圾邮件。您可以看到这一点,因为他们在定义中使用Z{s}和V{s},并且在示例中使用Z{spam}和C(w)=spam,所以他们在C(w)=spam的情况下演示了这一点,但定义是通用的,即覆盖C(w)=spam和C(w)=非spam

关于这一点:
{带下标“团c”}的乘积运算符({带下标c}(w,spam)的乘积运算符))
(w,spam)的定义没有在集合表示法中给出,只是在该术语被用作(w_{i},w_{j}的
局部概率之前的段落中非正式地给出
C(w)=s
。恐怕我不知道局部概率是什么意思,我想它和马尔可夫理论有关吧


关于加权方案的定义,我真的不知道。

我很好奇,在什么情况下你需要这些东西?您只是想在实现中使用它们,还是与此研究相关?两者都有。我正在制作一个内置垃圾邮件过滤的usenet阅读器。我实现了一个相当标准的Graham Baynesian过滤器,它似乎工作得很好,但我对这种马尔可夫方法感兴趣,因为它据称具有优越性。