Linux tesseract 3.03-输入jpg文件

Linux tesseract 3.03-输入jpg文件,linux,ocr,tesseract,Linux,Ocr,Tesseract,我想创建一个带有可选/可搜索文本的PDF 我有source.png,它在OCR之前经过了一些预处理,然后我有view.jpg,它是source.png的压缩版本,用于减少输出的PDF文件 如何在语法中定义view.jpg tesseract -l eng source.png out pdf 我不确定是否可以在命令中指定view.jpg。out.pdf已经包含某种压缩的source.png没有任何source.png直接使用,没有任何后期处理或我的测试压缩,所有结果输出pdf文件的文件大小都小

我想创建一个带有可选/可搜索文本的PDF

我有
source.png
,它在OCR之前经过了一些预处理,然后我有
view.jpg
,它是
source.png
的压缩版本,用于减少输出的PDF文件

如何在语法中定义
view.jpg

tesseract -l eng source.png out pdf

我不确定是否可以在命令中指定
view.jpg
out.pdf
已经包含某种压缩的
source.png

没有任何source.png直接使用,没有任何后期处理或我的测试压缩,所有结果输出pdf文件的文件大小都小于输入图像文件。