Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/318.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 现成的垃圾邮件过滤?_Java_Classification_Spam Prevention - Fatal编程技术网

Java 现成的垃圾邮件过滤?

Java 现成的垃圾邮件过滤?,java,classification,spam-prevention,Java,Classification,Spam Prevention,我在一个社交媒体监控系统上工作。我们自己不爬网,我们从Spinn3r这样的聚合器获取提要。在大多数情况下,只不过是色情网站链接页面的“博客”会被过滤掉,但我们希望内部的一些东西能够比等待上游提供商做出改变更快地进行培训 我看了Spamassassin,如果我们处理电子邮件,这将是我们的理想选择。有没有一个库可以只获取一个文本体,并根据工作频率、链接数量、隐藏的背景文本等给它一个质量分数 理想情况下,我正在寻找Java中的一些东西,但如果没有,我可以使用客户机服务器或嵌入jruby或jython库

我在一个社交媒体监控系统上工作。我们自己不爬网,我们从Spinn3r这样的聚合器获取提要。在大多数情况下,只不过是色情网站链接页面的“博客”会被过滤掉,但我们希望内部的一些东西能够比等待上游提供商做出改变更快地进行培训

我看了Spamassassin,如果我们处理电子邮件,这将是我们的理想选择。有没有一个库可以只获取一个文本体,并根据工作频率、链接数量、隐藏的背景文本等给它一个质量分数

理想情况下,我正在寻找Java中的一些东西,但如果没有,我可以使用客户机服务器或嵌入jruby或jython库


我想我最终将不得不自己构建它,但它总是值得一试。

WordPress有一些垃圾插件可以捕捉垃圾评论。谷歌搜索结果:和

WordPress插件似乎是用PHP实现的。也许那里会有一些有用的东西