Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/258.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 如何检查文本中是否有胡言乱语?_C#_Language Recognition - Fatal编程技术网

C# 如何检查文本中是否有胡言乱语?

C# 如何检查文本中是否有胡言乱语?,c#,language-recognition,C#,Language Recognition,我得到一个文本字符串,我想验证文本是否乱码。我所说的胡言乱语是指像“GFGSOGJW”这样的文本,即随机键盘按键。目前,我使用NTextCat来简单地检查字符串的语言是否与我期望的语言(德语或英语)匹配,这在大多数情况下都可以正常工作。然而,一小部分无意义的弦确实能够从裂缝中滑过。有没有其他方法来检查乱七八糟的文本,从而提高准确性?您可以使用隐马尔可夫模型来检查您输入的具体语言中字母序列的概率。然后扔掉那些可能性最小的。你也可以用词的搭配来做同样的事情。在这两种情况下,您都必须获得每种语言的文本

我得到一个文本字符串,我想验证文本是否乱码。我所说的胡言乱语是指像“GFGSOGJW”这样的文本,即随机键盘按键。目前,我使用NTextCat来简单地检查字符串的语言是否与我期望的语言(德语或英语)匹配,这在大多数情况下都可以正常工作。然而,一小部分无意义的弦确实能够从裂缝中滑过。有没有其他方法来检查乱七八糟的文本,从而提高准确性?

您可以使用隐马尔可夫模型来检查您输入的具体语言中字母序列的概率。然后扔掉那些可能性最小的。你也可以用词的搭配来做同样的事情。在这两种情况下,您都必须获得每种语言的文本语料库,才能在此基础上构建模型。

尝试此链接