Fonts 粘贴后,重音字符看起来很奇怪(其重音显示在字符后面)

Fonts 粘贴后,重音字符看起来很奇怪(其重音显示在字符后面),fonts,non-ascii-characters,Fonts,Non Ascii Characters,我不确定这是不是一个合适的地方,但我还是要问。。。 我一直在和一个德国客户合作,这个非常棘手的问题开始出现了 因此,在填充网站内容的同时,我将他们的pdf表单复制/粘贴到我的编辑器(浓缩咖啡)中。wierd的事情是,当所有文本在编辑器上看起来都很原始时,在浏览器中打开时,我们开始得到带有重音字符的重音的wierd异常,被向前推。所以一个“Ö”显示为“O”,等等 我认为这是一些unicode问题,但该网站被声明为utf8,没有富文本或任何输入内容,只是编辑器中的原始文本。因此,这确实令人难以置信。

我不确定这是不是一个合适的地方,但我还是要问。。。 我一直在和一个德国客户合作,这个非常棘手的问题开始出现了

因此,在填充网站内容的同时,我将他们的pdf表单复制/粘贴到我的编辑器(浓缩咖啡)中。wierd的事情是,当所有文本在编辑器上看起来都很原始时,在浏览器中打开时,我们开始得到带有重音字符的重音的wierd异常,被向前推。所以一个“Ö”显示为“O”,等等

我认为这是一些unicode问题,但该网站被声明为utf8,没有富文本或任何输入内容,只是编辑器中的原始文本。因此,这确实令人难以置信。如果客户端直接编辑文件,其显示正确。我发现,如果我手动键入并替换重音字符,也可以

有没有人有过类似的经历/解决方案


我认为不应该存在本地化/字体问题,因为这些基本上都是拉丁字符(如果我错了,请纠正我)

您无法可靠地从PDF中剪切和粘贴。内部格式与看起来的不一样。:-)

PDF可能在内部使用特殊编码以使打印的页面看起来正确,但这并不意味着您可以复制粘贴

这里有一个StackExchange问题,有一点背景知识:

虽然这与您的问题不完全相同,但它确实表明了如何制作PDF很重要。可能某些拉丁-1(重音)字符在PDF中编码为字符,而不是预期的Unicode码点,而是使用绘图指令,以使字符正确显示


也许可以帮助你。我没有使用过它,所以不能推荐它,但稍微搜索一下可能会得到一些你可以使用的东西。(这一个声称支持德语。)

你无法可靠地从PDF中剪切和粘贴。内部格式与表面上的不一样。:-)

PDF可能在内部使用特殊编码以使打印的页面看起来正确,但这并不意味着您可以复制粘贴

这里有一个StackExchange问题,有一点背景知识:

虽然这与您的问题不完全相同,但它确实表明了如何制作PDF很重要。可能某些拉丁-1(重音)字符在PDF中编码为字符,而不是预期的Unicode码点,而是使用绘图指令,以使字符正确显示


也许可以帮助你。我没有使用过它,所以不能推荐它,但是稍微搜索一下可能会得到一些你可以使用的东西。(这一个声称支持德语。)

你不能可靠地从一些PDF文件中剪切和粘贴。PDF格式确实支持以一种非常适合复制和粘贴的方式存储文本(包括“奇怪”)“字符)。不幸的是,并不是所有的PDF文件都使用这些功能(或者正确地使用它们)。我假设如果你从任何richtext格式(word/PDF/etc)剪切并粘贴到代码编辑器中,它会自动将文本转换为原始的非格式相关文本,不是吗?如何从pdf中“提取”文本以供web使用?出于某种奇怪的原因,使用Latex生成的pdf文件倾向于使用合成的UMLAUT而不是“真实”的UMLAUT。感谢您宝贵的输入。:)这真是令人难以置信。@Ray:再说一遍:如果PDF阅读器知道编码以及如何解释它:为什么它不首先将正确转换的内容放在剪贴板上?你不能可靠地从一些PDF文件中剪切和粘贴。PDF格式确实支持以非常适合复制和粘贴的方式存储文本(包括“奇怪”字符)。不幸的是,并不是所有的PDF文件都使用这些功能(或者正确地使用它们)。我假设如果你从任何richtext格式(word/PDF/etc)剪切并粘贴到代码编辑器中,它会自动将文本转换为原始的非格式相关文本,不是吗?如何从pdf中“提取”文本以供web使用?出于某种奇怪的原因,使用Latex生成的pdf文件倾向于使用合成的UMLAUT而不是“真实”的UMLAUT。感谢您宝贵的输入。:)这真是令人难以置信。@Ray:再说一遍:如果PDF阅读器知道编码以及如何解释它:为什么它不首先将正确转换的内容放在剪贴板上?