Open source 最准确的日语开源OCR?

Open source 最准确的日语开源OCR?,open-source,ocr,Open Source,Ocr,根据您的经验,阅读日语文本最准确的开源光学字符识别(OCR)库/软件是什么 我刚刚试过,即使在一个非常干净的高清文档上,错误率也超过2%。我自己还没有试过,但也许你应该看看。我有一些ABBYY解决方案的研发经验-FineReader引擎。当时是8.1版,我还没有更新他们的最新版本。但在当时,这只是我能找到的最好的手持式扫描仪产品。我极力推荐 顺便说一句,在购买XEROX PE220打印机时,您可以为最终用户免费获得ABBYY OCR软件包的版本,该软件包与XEROX PE220打印机捆绑在一起。

根据您的经验,阅读日语文本最准确的开源光学字符识别(OCR)库/软件是什么


我刚刚试过,即使在一个非常干净的高清文档上,错误率也超过2%。

我自己还没有试过,但也许你应该看看。

我有一些ABBYY解决方案的研发经验-FineReader引擎。当时是8.1版,我还没有更新他们的最新版本。但在当时,这只是我能找到的最好的手持式扫描仪产品。我极力推荐


顺便说一句,在购买XEROX PE220打印机时,您可以为最终用户免费获得ABBYY OCR软件包的版本,该软件包与XEROX PE220打印机捆绑在一起。那台打印机在我桌上放了好几年了。必须有其他打印机与它捆绑在里面。施乐公司也把iOCR作为最佳选择。

基于缺乏答案,nhocr似乎是日语最准确的开源OCR。

请尝试。服务器版本和下载版本可用。

日语不可用,即使是单独下载:自述文件简要提到日语已被删除,并在某处可用,但实际上找不到:-(在邮件列表上,一位用户报告说在60个日语字符上训练Tesseract取得了一些成功,但这显然是实验性的。总之,这可能是可能的,但实际上没有人使用Tesseract进行日语训练。我不懂日语,但他们有一个日语小组这一事实似乎很有趣:(但看看它,它可能是日本版的国际版,如果我浪费了你的时间,很抱歉)@Nicolas我已经打开了关于缺少CJK数据的问题files@SamB:谢谢!这里似乎有日语的培训文件:。如果它隐藏得很好,我想它没有太多使用。@Whanfrieden:是的,我试过了,现在还不错!FineReader不是开源的。而且您使用的版本不支持日语:抱歉,没有看到开源请求。它不是开源的。我使用的版本有CJK支持(中文、日文和韩文),这是引擎的一个附加组件。我们使用它向东南部买家展示我们的技术。请参见:(复制URL,因为这样会破坏它)@Etamar ABBYY OCR很有趣。他们允许与自定义词典集成、自定义bigrams分析等吗?我们需要使用这些技术来提高OCR的准确性。@简而言之,phaedrus-是的。我已经使用他们的引擎多年了,可以集成我想要的任何东西。词典是一项基本功能,yo你可以定制它们。为禅宗和艺术干杯。@Etamar谢谢你的评论:)如果我理解的很好,WeOCR只是其他OCR引擎的一个Web前端。特别是,它使用nhocr进行日语测试。所以我想它并不比nhocr更准确,对吗?请看TODO项目之一是“为日语开发OCR”它链接到nhocrYah。这是正确的。就在几个月前,我试用了他们的在线服务器版本。但这远远不准确。日本手机。特别是夏普手机有非常出色的OCR功能。但我没有找到其他免费的OCR软件。当然,夏普目前没有销售他们的OCR软件。就其价值而言,2%对于OCR来说并不可怕。我们很难用罗马体来实现这一点。2%用于大字体的超清晰字符。对于扫描的书籍,情况更糟,更不用说手写表格了。