使用Acrobat Pro导出PDF>HTML,是否显示所有特殊字符?尽管有明显的UTF-8编码。

使用Acrobat Pro导出PDF>HTML,是否显示所有特殊字符?尽管有明显的UTF-8编码。,pdf,encoding,utf-8,acrobat,Pdf,Encoding,Utf 8,Acrobat,我有一组PDF,我正在使用HTML4.01导出选项将其导出为HTML文件。当我在SublimateText或Chrome中打开文件时,所有特殊字符都显示为?。声明的编码是UTF-8: <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html40/strict.dtd"> <!-- Created from PDF via Acrobat SaveAsXML --> <

我有一组PDF,我正在使用HTML4.01导出选项将其导出为HTML文件。当我在SublimateText或Chrome中打开文件时,所有特殊字符都显示为?。声明的编码是UTF-8:

 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html40/strict.dtd">
 <!-- Created from PDF via Acrobat SaveAsXML -->
 <!-- Mapping table version: 28-February-2003 -->
 <HTML>
 <HEAD>
 <META http-equiv="Content-Type" content="text/html; charset=UTF-8">
如果使用SublimitText Save with encoding-选项并使用UTF-8保存,则问题仍然存在。
奇怪的是,这种情况只发生在一些PDF上。其他人则使用正确的编码进行保存,但在导出过程中没有区别。在PDF文件本身或导出过程中,我是否可以检查任何内容以了解这一点?

我可以检查的任何内容-像往常一样:如果您在Acrobat中选择此文本,将其复制并粘贴到记事本中,您是否按预期获得文本?是的,如果我将文本从PDF复制到记事本,我将获得预期的字符。