Fonts 明确设置Tesseract OCR用于识别的字体

Fonts 明确设置Tesseract OCR用于识别的字体,fonts,ocr,tesseract,Fonts,Ocr,Tesseract,我的文档在整个文档中只使用一种字体。不同的文档可能有不同的字体,但我知道哪个文档使用哪种字体 有没有一个选项可以明确告诉Tesseract OCR在识别给定图像时使用哪种字体?没有,我认为Tesseract不支持这样的选项。您可以做的是针对一种特定字体进行训练,然后在识别文档时指定该训练数据。为了帮助调试,您可以将tesserate\u debug\u font设置为1,以确定tesseract如何识别字体

我的文档在整个文档中只使用一种字体。不同的文档可能有不同的字体,但我知道哪个文档使用哪种字体


有没有一个选项可以明确告诉Tesseract OCR在识别给定图像时使用哪种字体?

没有,我认为Tesseract不支持这样的选项。您可以做的是针对一种特定字体进行训练,然后在识别文档时指定该训练数据。

为了帮助调试,您可以将
tesserate\u debug\u font
设置为1,以确定tesseract如何识别字体