Java:如何验证自然语言文本

Java:如何验证自然语言文本,java,nlp,Java,Nlp,我正在使用OCR识别图像中的(德语)文本。它工作得很好,但并不完美。有时一个词会被弄乱。因此,我想实现某种验证。当然,我可以使用一个单词列表,找到与混乱的单词相似的单词,但是有没有办法检查这个句子是否与这些单词相符 毕竟,我的智能手机可以给我很好的建议如何完成一个句子。你需要寻找自然语言处理(NLP)解决方案。使用它们,您可以在语法上验证词汇(或者是整个文本,其中一些可能会考虑上下文,这可能更好,或者是逐短语) 我不是这方面的专家,但本文可以帮助您选择一个工具开始尝试 另外,请注意:您手机上的键

我正在使用OCR识别图像中的(德语)文本。它工作得很好,但并不完美。有时一个词会被弄乱。因此,我想实现某种验证。当然,我可以使用一个单词列表,找到与混乱的单词相似的单词,但是有没有办法检查这个句子是否与这些单词相符


毕竟,我的智能手机可以给我很好的建议如何完成一个句子。

你需要寻找自然语言处理(NLP)解决方案。使用它们,您可以在语法上验证词汇(或者是整个文本,其中一些可能会考虑上下文,这可能更好,或者是逐短语)

我不是这方面的专家,但本文可以帮助您选择一个工具开始尝试

另外,请注意:您手机上的键盘是由专业团队开发和维护的,无论是苹果、谷歌还是您使用其应用程序的任何其他公司。所以,请不要低估这项任务:在这方面有几十个研究领域,其中包括软件工程师和语言学专家,以获得适当的结果


编辑:两天后,我刚刚找到了这个链接:

寻找马尔可夫链,它是哪个元素更可能出现在给定元素之后。你可以在字母层面(哪个字母更可能)或者在单词层面(哪个更复杂)来做。在您的情况下,字母级别很可能就足够了。请看这里:抱歉,没有任何代码,这个问题太广泛了,无法在这里回答。每个人都想发表自己的意见。仅供参考:您的智能手机可以根据单词、句子列表以及单词的使用频率为您提供建议。如果是谷歌的在线服务。。那么我恐怕它太复杂了,无法复制。请转到以了解如何/问什么。仅仅放弃“这就是我想要的”的要求是不可取的。当你自己尝试某件事,并且遇到特定问题时,我们很乐意提供帮助。但请理解,这个地方并不是为了给你们提供指导,可能需要很多步骤才能让你们从愿景进入工作计划。毕竟,我的智能手机可以给我很好的建议如何完成一个句子。毕竟,迈克·泰森仍然可以击败你和我,还有这里的其他人。尽管他比你和我大很多,但我仍然有一个建议:你可以下载,并尝试将其集成到你的程序中。因此,在运行OCR后,您可以通过文本进行重复,并通过与词典进行比较来验证单词。这不会完美地工作,但至少它是可行的,并给你一些机会纠正至少一些话。