Linux 使用tesseract v3创建带有可搜索文本命令行的pdf文档

Linux 使用tesseract v3创建带有可搜索文本命令行的pdf文档,linux,command-line,ocr,tesseract,Linux,Command Line,Ocr,Tesseract,我们正在使用tessereact从tiff扫描文档中提取文本,我们使用tesseract命令行选项启动此功能,但是我们希望使用tesseract V3.0将此tiff扫描文档转换为具有可搜索文本的PDF,并且我们还需要使用命令行获取此功能 我们的系统是一个Ubuntu12服务器,有什么想法吗?我们一直在搜索Tesseract V3.0数据表,但未能正确理解 你们中有人得到类似的东西吗 提前谢谢大家 您需要v3.03来生成可搜索的PDF。您好,非常感谢您的澄清,但是我可以在哪里下载要安装到我们的u

我们正在使用tessereact从tiff扫描文档中提取文本,我们使用tesseract命令行选项启动此功能,但是我们希望使用tesseract V3.0将此tiff扫描文档转换为具有可搜索文本的PDF,并且我们还需要使用命令行获取此功能

我们的系统是一个Ubuntu12服务器,有什么想法吗?我们一直在搜索Tesseract V3.0数据表,但未能正确理解

你们中有人得到类似的东西吗


提前谢谢大家

您需要v3.03来生成可搜索的PDF。

您好,非常感谢您的澄清,但是我可以在哪里下载要安装到我们的ubuntu服务器上的版本,我们可以在哪里找到手册或用户指南?我一直在检查tesseract站点,但没有找到发布版本。谢谢!!它将在Ubuntu 14.04中发布。或者,您可以从中构建。命令是:
teseract yourmage outfile pdf