使用LibreOffice将.docx导出为PDF时出现错误的Unicode映射
使用LibreOffice将.docx文件转换为PDF/a-1a文件时,创建的文件不符合PDF/a-1a标准 当我尝试在Adobe Acrobat中使用Preflight验证文件时,会显示以下错误:使用LibreOffice将.docx导出为PDF时出现错误的Unicode映射,pdf,libreoffice,Pdf,Libreoffice,使用LibreOffice将.docx文件转换为PDF/a-1a文件时,创建的文件不符合PDF/a-1a标准 当我尝试在Adobe Acrobat中使用Preflight验证文件时,会显示以下错误: Text cannot be mapped to unicode (154 matches on 2 pages) 当我在Preview.app中从PDF复制文本时,所有重音字符都会丢失或弄乱 从我的研究中,我了解到LibreOffice没有为重音字符正确构建/ToUnicode映射,因为这些字符
Text cannot be mapped to unicode (154 matches on 2 pages)
当我在Preview.app中从PDF复制文本时,所有重音字符都会丢失或弄乱
从我的研究中,我了解到LibreOffice没有为重音字符正确构建/ToUnicode
映射,因为这些字符是为多个glyph构建的,而LibreOffice只是处理第一个glyph。参考:
有解决办法吗?如何在Linux上以编程方式将.docx转换为有效的PDF/A
以下是我用来转换文件的命令:
unoconv -f pdf -eSelectPdfVersion=1 source-file.docx
此另一个命令未按预期提供符合PDF/a的文件,但它具有相同的Unicode映射问题:
libreoffice --headless --convert-to pdf source-file.docx
我使用的LibreOffice 5.2.3.3存在问题。LibreOffice 5.1.4.2和5.1.6.2不存在此问题 因此,降级到5.1.6.2可以解决我的问题 我在现有的bug报告中添加了更多信息