Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/loops/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Php 如何确定一个单词是英语还是其他语言_Php_Algorithm_Nlp_Translation - Fatal编程技术网

Php 如何确定一个单词是英语还是其他语言

Php 如何确定一个单词是英语还是其他语言,php,algorithm,nlp,translation,Php,Algorithm,Nlp,Translation,我正在开发一个小型的图书馆自动化软件,我需要确定一个单词在或中。示例场景如下所示: 用户输入一个书名 确定是土耳其语还是英语 将language组合框设置为相应的语言,以帮助用户填写表单 我的一个朋友建议我“连接到谷歌翻译并使用它”,这似乎是合理的,但不连接外部服务或数据库的算法将更适合我。(我还搜索土耳其语/英语特定字符,如ç、ş、İ/w、x来决定)因此,我正在搜索一种算法来完成这项工作,可能基于字母频率或类似的内容。有没有文学作品?提前谢谢。(如果重要的话,我会使用php和mysql)如

我正在开发一个小型的图书馆自动化软件,我需要确定一个单词在或中。示例场景如下所示:

  • 用户输入一个书名
  • 确定是土耳其语还是英语
  • 将language组合框设置为相应的语言,以帮助用户填写表单

我的一个朋友建议我“连接到谷歌翻译并使用它”,这似乎是合理的,但不连接外部服务或数据库的算法将更适合我。(我还搜索土耳其语/英语特定字符,如ç、ş、İ/w、x来决定)因此,我正在搜索一种算法来完成这项工作,可能基于字母频率或类似的内容。有没有文学作品?提前谢谢。(如果重要的话,我会使用php和mysql)

如果你测试的样本很小(一个单词或短语),那么像字母频率这样的简单启发式方法就不会很有用,因为英语短语“Jazz Quizzes”可能比英语更适合许多语言

您可能能够使用双字母和三字母的频率(2个字母和3个字母的组合),因为英语和土耳其语完全不相关,因此只有一种组合出现

然而,更可能的情况是,您必须使用两种语言的实际单词数据库。在这种情况下,您最好使用第三方API或数据库,而不是全力以赴构建自己的小体、实现统计算法等。

如评论所述

请检查:

或:


Solr可以为您提供概率语言(例如,这句话是90%英语或10%土耳其语)

您也可以检查Solr可以为您提供概率语言(例如,这句话是90%英语或10%土耳其语)这两种语言的单词如何?谢谢所有答案。Dagon,我不期望有100%准确的算法,frenchie这是一个爱好项目,我认为提供这样的功能可能会很好。fsw,你的链接适合我。我会接受你的回答,如果你写它作为一个答案,而不是评论。