Linux tesseract 3.03-输入jpg文件
我想创建一个带有可选/可搜索文本的PDF 我有Linux tesseract 3.03-输入jpg文件,linux,ocr,tesseract,Linux,Ocr,Tesseract,我想创建一个带有可选/可搜索文本的PDF 我有source.png,它在OCR之前经过了一些预处理,然后我有view.jpg,它是source.png的压缩版本,用于减少输出的PDF文件 如何在语法中定义view.jpg tesseract -l eng source.png out pdf 我不确定是否可以在命令中指定view.jpg。out.pdf已经包含某种压缩的source.png没有任何source.png直接使用,没有任何后期处理或我的测试压缩,所有结果输出pdf文件的文件大小都小
source.png
,它在OCR之前经过了一些预处理,然后我有view.jpg
,它是source.png
的压缩版本,用于减少输出的PDF文件
如何在语法中定义view.jpg
tesseract -l eng source.png out pdf
我不确定是否可以在命令中指定
view.jpg
。out.pdf
已经包含某种压缩的source.png
没有任何source.png直接使用,没有任何后期处理或我的测试压缩,所有结果输出pdf文件的文件大小都小于输入图像文件。