C# 如何检查文本中是否有胡言乱语?
我得到一个文本字符串,我想验证文本是否乱码。我所说的胡言乱语是指像“GFGSOGJW”这样的文本,即随机键盘按键。目前,我使用NTextCat来简单地检查字符串的语言是否与我期望的语言(德语或英语)匹配,这在大多数情况下都可以正常工作。然而,一小部分无意义的弦确实能够从裂缝中滑过。有没有其他方法来检查乱七八糟的文本,从而提高准确性?您可以使用隐马尔可夫模型来检查您输入的具体语言中字母序列的概率。然后扔掉那些可能性最小的。你也可以用词的搭配来做同样的事情。在这两种情况下,您都必须获得每种语言的文本语料库,才能在此基础上构建模型。尝试此链接C# 如何检查文本中是否有胡言乱语?,c#,language-recognition,C#,Language Recognition,我得到一个文本字符串,我想验证文本是否乱码。我所说的胡言乱语是指像“GFGSOGJW”这样的文本,即随机键盘按键。目前,我使用NTextCat来简单地检查字符串的语言是否与我期望的语言(德语或英语)匹配,这在大多数情况下都可以正常工作。然而,一小部分无意义的弦确实能够从裂缝中滑过。有没有其他方法来检查乱七八糟的文本,从而提高准确性?您可以使用隐马尔可夫模型来检查您输入的具体语言中字母序列的概率。然后扔掉那些可能性最小的。你也可以用词的搭配来做同样的事情。在这两种情况下,您都必须获得每种语言的文本