在R中培训Tesseract-可能吗？_R_Ocr_Tesseract_Training Data_Receipt

在R中培训Tesseract-可能吗？

在R中培训Tesseract-可能吗？,r,ocr,tesseract,training-data,receipt,R,Ocr,Tesseract,Training Data,Receipt,我试图在R中使用Tesseract和Magick的组合来读取超市收据。考虑到没有预处理，我的第一次尝试（见尝试1）效果相当好。下面列出的我的第二次尝试似乎表现稍好一些。总之，我想我有两个问题问题1：是否可以在R中培训Tesseract软件包？问题2：如果有可能对一揽子计划进行培训，如何进行？我想象有什么方法可以通过手动更正错误来提高性能作为补充说明，我尝试了abbyr软件包，该软件包再次获得了稍好的效果，但价格昂贵尝试1 text1% 图像转换（颜色空间='灰色'）%>% 图像_trim

我试图在R中使用Tesseract和Magick的组合来读取超市收据。考虑到没有预处理，我的第一次尝试（见尝试1）效果相当好。下面列出的我的第二次尝试似乎表现稍好一些。总之，我想我有两个问题

问题1：是否可以在R中培训Tesseract软件包？问题2：如果有可能对一揽子计划进行培训，如何进行？我想象有什么方法可以通过手动更正错误来提高性能

作为补充说明，我尝试了abbyr软件包，该软件包再次获得了稍好的效果，但价格昂贵

尝试1

text1%
图像转换（颜色空间='灰色'）%>%
图像_trim（）%>%
发动机=tesseract（“发动机”）%>%
图像光学字符识别（ocr）
猫（文本2）

text1 <- ocr("Receipt.jpg", engine = tesseract("eng"))
cat(text1)

text2 <- image_read("Receipt.jpg") %>%
  image_resize("2000") %>%
  image_convert(colorspace = 'gray') %>%
  image_trim() %>%
  engine = tesseract("eng") %>%
  image_ocr()

cat(text2)