Amazon ec2 在Linux上为.jpg运行tesseract OCR时出错

Amazon ec2 在Linux上为.jpg运行tesseract OCR时出错,amazon-ec2,ocr,tesseract,Amazon Ec2,Ocr,Tesseract,我成功地在我的AmazonEC2实例上安装了tesseract。它适用于TIFF图像,但当我尝试在JPG上运行它时,我得到: Tesseract Open Source OCR Engine v3.02.02 with Leptonica Error in pixReadStreamJpeg: function not present Error in pixReadStream: jpeg: no pix returned Error in pixRead: pix not read Unsu

我成功地在我的AmazonEC2实例上安装了tesseract。它适用于TIFF图像,但当我尝试在JPG上运行它时,我得到:

Tesseract Open Source OCR Engine v3.02.02 with Leptonica
Error in pixReadStreamJpeg: function not present
Error in pixReadStream: jpeg: no pix returned
Error in pixRead: pix not read
Unsupported image type.

我还需要安装/执行什么操作?

我也遇到了同样的问题。这是因为您的leptonica安装可能存在一些问题。再次尝试重新安装leptonica:

$tar -xvf leptonica-xx.tar.gz
$cd leptonica folder
$./configure
$make
$sudo make install    
完成后,您可以通过以下方式检查是否正确安装了所有库:

$tesseract -v
然后,它将显示已安装的4个LIB:

tesseract 3.02.02
leptonica-1.71
libjpeg 6b : libpng 1.2.49 : libtiff 3.9.4 : zlib 1.2.3

干杯:)

我遇到了同样的问题,我必须手动安装所有映像库,然后重新安装leptonica

./configure && make && sudo make install
首先安装这个

sudo apt-get install libjpeg-dev libpng-dev libtiff4-dev
然后重新安装瘦肉精

./configure && make && sudo make install

在CentOS 6.7上,即使安装了
libpng-devel
,在重新安装
leptonica
后,
tesseract-v
仍将缺少
libpng
支持。我也会重新编译tesseract。