C# 如何检测我的网站上的恶意评论?

C# 如何检测我的网站上的恶意评论?,c#,.net,C#,.net,我有我的网站,我给了用户分享他们的状态的机会。我怎样才能发现是否使用了辱骂或俚语来阻止这些评论 是否有任何库或技巧来检测中的此类评论?这不是一个技巧;使用坏词词典,并添加一些逻辑来检测好地方的“坏词”。增加了用户发布关于错误纠正逻辑的投诉的功能(以便您可以对其进行微调),仅此而已 实现起来相当简单,而且有一本“坏词”字典——要么查一下,要么自己写一本 (我过去常常在聊天服务上收集客户投诉中的脏话,一年后,这几乎是无懈可击的。)这实际上很难实现自动化,也很难做到准确无误。您可以维护一个坏单词词典,

我有我的网站,我给了用户分享他们的状态的机会。我怎样才能发现是否使用了辱骂或俚语来阻止这些评论


是否有任何库或技巧来检测中的此类评论?

这不是一个技巧;使用坏词词典,并添加一些逻辑来检测好地方的“坏词”。增加了用户发布关于错误纠正逻辑的投诉的功能(以便您可以对其进行微调),仅此而已

实现起来相当简单,而且有一本“坏词”字典——要么查一下,要么自己写一本


(我过去常常在聊天服务上收集客户投诉中的脏话,一年后,这几乎是无懈可击的。)

这实际上很难实现自动化,也很难做到准确无误。您可以维护一个坏单词词典,并使用正则表达式替换这些坏单词的出现。请参阅我对以下问题的回答,例如代码,以及一些问题:


自动化方法有许多缺点:误报、缺少字典中没有的坏单词,以及未检测到的坏单词的微小变化。用户的参与可以用来支持或作为一种替代方法,例如,SO有能力标记评论,版主可以删除或审查评论。

有一些坏词列表,您可以下载和使用

例如


最好的办法是从一个小列表开始,根据你网站上的真实评论添加到列表中。您可以在评论上添加一个报告链接,以便其他访问者可以在有不好的评论时通知您。

只是不要将clbuttic错误带到buttume,您可以替换任何事件或单词。:)+没有什么比人类思维更能识别坏词了,但是由这些人训练的计算机可以非常接近。比天真的下载黑名单方法更好的一些其他方法是使用贝叶斯过滤(不过滤单个单词,而是一组单词,通过接受常见的合法用法,您可以过滤出更多的边缘单词)。然后,认识到您不必平等对待所有用户。如果您的用户使用一些“标志为淫秽”来训练过滤器,您可以查看哪些用户在统计上收到投诉(不仅仅是自动拒绝)。任何经网站管理员确认的粗话都可能导致账户被永久扣分。OTOH,一个在3年的活动中没有产生投诉的账户可能完全不需要过滤。