Algorithm 描述马尔可夫判别算法的公式理解困难_Algorithm_Math_Spam Prevention_Discrete Mathematics

Algorithm 描述马尔可夫判别算法的公式理解困难

algorithm math

Algorithm 描述马尔可夫判别算法的公式理解困难,algorithm,math,spam-prevention,discrete-mathematics,Algorithm,Math,Spam Prevention,Discrete Mathematics,我已经仔细研究了这篇论文（）好几天了，但是还没有理解第3节或之后的任何公式特别是，我不理解这些部分的含义： p（w | C（w）=s） /* 文档是垃圾邮件的概率取决于文档中的给定单词是否为垃圾邮件？ */ p（w | C（w）=垃圾邮件） /* 这个概率和前面的表达式一样吗？为什么是“垃圾邮件”而不是“s”，反之亦然？ */ {带下标“团c”}的乘积运算符（{带下标c}（w，spam）的乘积运算符）） /* 在本文中，最里面的表达式据说是指局部概率，但我不理解它的表示法。产品操作符后面的（w

我已经仔细研究了这篇论文（）好几天了，但是还没有理解第3节或之后的任何公式

特别是，我不理解这些部分的含义：

p（w | C（w）=s） /* 文档是垃圾邮件的概率取决于文档中的给定单词是否为垃圾邮件？ */

p（w | C（w）=垃圾邮件） /* 这个概率和前面的表达式一样吗？为什么是“垃圾邮件”而不是“s”，反之亦然？ */

{带下标“团c”}的乘积运算符（{带下标c}（w，spam）的乘积运算符））

/* 在本文中，最里面的表达式据说是指局部概率，但我不理解它的表示法。产品操作符后面的（w，spam）是有序集还是函数？它的功能是什么？ */

我也不理解任何带有二项式系数的公式，但对于那些公式，至少我认为我知道我应该开始读什么。

关于前两个，第一个对我来说就像它是s中s的变量。

。第二个只讨论C（w）=spam，在哪些情况下s=垃圾邮件。您可以看到这一点，因为他们在定义中使用Z{s}和V{s}，并且在示例中使用Z{spam}和C（w）=spam，所以他们在C（w）=spam的情况下演示了这一点，但定义是通用的，即覆盖C（w）=spam和C（w）=非spam

关于这一点：
{带下标“团c”}的乘积运算符（{带下标c}（w，spam）的乘积运算符））
（w，spam）的定义没有在集合表示法中给出，只是在该术语被用作（w_{i}，w_{j}的

局部概率之前的段落中非正式地给出
C（w）=s

。恐怕我不知道局部概率是什么意思，我想它和马尔可夫理论有关吧

关于加权方案的定义，我真的不知道。

我很好奇，在什么情况下你需要这些东西？您只是想在实现中使用它们，还是与此研究相关？两者都有。我正在制作一个内置垃圾邮件过滤的usenet阅读器。我实现了一个相当标准的Graham Baynesian过滤器，它似乎工作得很好，但我对这种马尔可夫方法感兴趣，因为它据称具有优越性。