Command line 在Windows与Ubuntu服务器中使用pdftotext

Command line 在Windows与Ubuntu服务器中使用pdftotext,command-line,ubuntu-12.04,pdftotext,Command Line,Ubuntu 12.04,Pdftotext,在我的Windows 7 PC上,命令行输入“pdftotext myfile.pdf”会在与myfile.pdf相同的目录中创建一个.txt文件。然而,当我在我的ubuntu-12.04服务器上使用相同的myfile.pdf尝试相同的命令行输入时,我得到一个错误输出,如下所示: Error: May not be a PDF file (continuing anyway) Error (2): Illegal character <21> in hex string Error

在我的Windows 7 PC上,命令行输入“pdftotext myfile.pdf”会在与myfile.pdf相同的目录中创建一个.txt文件。然而,当我在我的ubuntu-12.04服务器上使用相同的myfile.pdf尝试相同的命令行输入时,我得到一个错误输出,如下所示:

Error: May not be a PDF file (continuing anyway)
Error (2): Illegal character <21> in hex string
Error (4): Illegal character <4f> in hex string
Error (6): Illegal character <54> in hex string
Error (7): Illegal character <59> in hex string
Error (8): Illegal character <50> in hex string
Error (11): Illegal character <48> in hex string
Error (12): Illegal character <54> in hex string
Error (13): Illegal character <4d> in hex string
Error (14): Illegal character <4c> in hex string
Error (16): Illegal character <50> in hex string
Error (17): Illegal character <55> in hex string
Error (19): Illegal character <4c> in hex string
Error (20): Illegal character <49> in hex string
Error (23): Illegal character <22> in hex string
Error (24): Illegal character <2d> in hex string
Error (25): Illegal character <2f> in hex string
Error (26): Illegal character <2f> in hex string
Error (27): Illegal character <57> in hex string
Error (30): Illegal character <2f> in hex string
Error (31): Illegal character <2f> in hex string
Error (33): Illegal character <54> in hex string
Error (36): Illegal character <48> in hex string
Error (37): Illegal character <54> in hex string
Error (38): Illegal character <4d> in hex string
错误:可能不是PDF文件(仍在继续)
错误(2):十六进制字符串中的非法字符
错误(4):十六进制字符串中的非法字符
错误(6):十六进制字符串中的非法字符
错误(7):十六进制字符串中的非法字符
错误(8):十六进制字符串中的非法字符
错误(11):十六进制字符串中的非法字符
错误(12):十六进制字符串中的非法字符
错误(13):十六进制字符串中的非法字符
错误(14):十六进制字符串中的非法字符
错误(16):十六进制字符串中的非法字符
错误(17):十六进制字符串中的非法字符
错误(19):十六进制字符串中的非法字符
错误(20):十六进制字符串中的非法字符
错误(23):十六进制字符串中的非法字符
错误(24):十六进制字符串中的非法字符
错误(25):十六进制字符串中的非法字符
错误(26):十六进制字符串中的非法字符
错误(27):十六进制字符串中的非法字符
错误(30):十六进制字符串中的非法字符
错误(31):十六进制字符串中的非法字符
错误(33):十六进制字符串中的非法字符
错误(36):十六进制字符串中的非法字符
错误(37):十六进制字符串中的非法字符
错误(38):十六进制字符串中的非法字符
等等

Error (122): Illegal character <6c> in hex string
Error: PDF file is damaged - attempting to reconstruct xref table...
Error: Couldn't find trailer dictionary
Error: Couldn't read xref table
错误(122):十六进制字符串中的非法字符
错误:PDF文件已损坏-正在尝试重建外部参照表。。。
错误:找不到拖车字典
错误:无法读取外部参照表

Windows 7 pdf实用程序包是否与Linux上可用的(来自Poppler)不同?否则,相同的调用将产生相同的结果,否?

这是因为您尝试作为输入的文件不是PDF文件

它以开头(空格是未知字符)

…这可以很快解释为

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML