Php 如何确定一个单词是英语还是其他语言
我正在开发一个小型的图书馆自动化软件,我需要确定一个单词在或中。示例场景如下所示:Php 如何确定一个单词是英语还是其他语言,php,algorithm,nlp,translation,Php,Algorithm,Nlp,Translation,我正在开发一个小型的图书馆自动化软件,我需要确定一个单词在或中。示例场景如下所示: 用户输入一个书名 确定是土耳其语还是英语 将language组合框设置为相应的语言,以帮助用户填写表单 我的一个朋友建议我“连接到谷歌翻译并使用它”,这似乎是合理的,但不连接外部服务或数据库的算法将更适合我。(我还搜索土耳其语/英语特定字符,如ç、ş、İ/w、x来决定)因此,我正在搜索一种算法来完成这项工作,可能基于字母频率或类似的内容。有没有文学作品?提前谢谢。(如果重要的话,我会使用php和mysql)如
- 用户输入一个书名
- 确定是土耳其语还是英语
- 将language组合框设置为相应的语言,以帮助用户填写表单李>
我的一个朋友建议我“连接到谷歌翻译并使用它”,这似乎是合理的,但不连接外部服务或数据库的算法将更适合我。(我还搜索土耳其语/英语特定字符,如ç、ş、İ/w、x来决定)因此,我正在搜索一种算法来完成这项工作,可能基于字母频率或类似的内容。有没有文学作品?提前谢谢。(如果重要的话,我会使用php和mysql)如果你测试的样本很小(一个单词或短语),那么像字母频率这样的简单启发式方法就不会很有用,因为英语短语“Jazz Quizzes”可能比英语更适合许多语言 您可能能够使用双字母和三字母的频率(2个字母和3个字母的组合),因为英语和土耳其语完全不相关,因此只有一种组合出现 然而,更可能的情况是,您必须使用两种语言的实际单词数据库。在这种情况下,您最好使用第三方API或数据库,而不是全力以赴构建自己的小体、实现统计算法等。如评论所述 请检查: 或:
Solr可以为您提供概率语言(例如,这句话是90%英语或10%土耳其语)您也可以检查Solr可以为您提供概率语言(例如,这句话是90%英语或10%土耳其语)这两种语言的单词如何?谢谢所有答案。Dagon,我不期望有100%准确的算法,frenchie这是一个爱好项目,我认为提供这样的功能可能会很好。fsw,你的链接适合我。我会接受你的回答,如果你写它作为一个答案,而不是评论。