在R中培训Tesseract-可能吗?

在R中培训Tesseract-可能吗?,r,ocr,tesseract,training-data,receipt,R,Ocr,Tesseract,Training Data,Receipt,我试图在R中使用Tesseract和Magick的组合来读取超市收据。考虑到没有预处理,我的第一次尝试(见尝试1)效果相当好。下面列出的我的第二次尝试似乎表现稍好一些。总之,我想我有两个问题 问题1:是否可以在R中培训Tesseract软件包? 问题2:如果有可能对一揽子计划进行培训,如何进行?我想象有什么方法可以通过手动更正错误来提高性能 作为补充说明,我尝试了abbyr软件包,该软件包再次获得了稍好的效果,但价格昂贵 尝试1 text1% 图像转换(颜色空间='灰色')%>% 图像_trim

我试图在R中使用Tesseract和Magick的组合来读取超市收据。考虑到没有预处理,我的第一次尝试(见尝试1)效果相当好。下面列出的我的第二次尝试似乎表现稍好一些。总之,我想我有两个问题

问题1:是否可以在R中培训Tesseract软件包? 问题2:如果有可能对一揽子计划进行培训,如何进行?我想象有什么方法可以通过手动更正错误来提高性能

作为补充说明,我尝试了abbyr软件包,该软件包再次获得了稍好的效果,但价格昂贵

尝试1
text1%
图像转换(颜色空间='灰色')%>%
图像_trim()%>%
发动机=tesseract(“发动机”)%>%
图像光学字符识别(ocr)
猫(文本2)
text1 <- ocr("Receipt.jpg", engine = tesseract("eng"))
cat(text1)
text2 <- image_read("Receipt.jpg") %>%
  image_resize("2000") %>%
  image_convert(colorspace = 'gray') %>%
  image_trim() %>%
  engine = tesseract("eng") %>%
  image_ocr()

cat(text2)