Character encoding 崇高的文本:不具有代表性的字符

Character encoding 崇高的文本:不具有代表性的字符,character-encoding,sublimetext2,sublimetext,sublimetext3,Character Encoding,Sublimetext2,Sublimetext,Sublimetext3,我使用升华文本作为Latex,所以我需要使用特定的编码。但是,在某些情况下,当我粘贴从其他程序(大多数情况下是word/浏览器)复制的文本时,我会收到以下消息: "Not all characters are representable in XXX encoding, falling back to UTF-8" 我的问题是:有没有办法看到文本的哪些部分无法编码,这样我就可以手动删除它们?我遇到了这个问题。它是由文档中的损坏字符引起的。下面是我如何解决它的 1)在文档中搜索所有标准字符。确保

我使用升华文本作为Latex,所以我需要使用特定的编码。但是,在某些情况下,当我粘贴从其他程序(大多数情况下是word/浏览器)复制的文本时,我会收到以下消息:

"Not all characters are representable in XXX encoding, falling back to UTF-8"

我的问题是:有没有办法看到文本的哪些部分无法编码,这样我就可以手动删除它们?

我遇到了这个问题。它是由文档中的损坏字符引起的。下面是我如何解决它的

1)在文档中搜索所有标准字符。确保在搜索中启用正则表达式,然后粘贴以下内容:

[^a-zA-Z0-9 -\.;<>/ ={}\[\]\^\?_\\\|:\r\n@]
[^a-zA-Z0-9-\.;/={}\[\]\^?\\\\\\\\\\\\\\\\\\:\r\n@]
您可以添加您的语言的正常重音字符,这里是法语和德语的字符。例如等:

[^a-zA-Z0-9 -\.;<>/ ='{}\[\]\^\?_\\\|:\r\n~@éàèêîôâûçäöüÄÖÜß]
[^a-zA-Z0-9-\.;/='{}\[\]\\\\\\\\\\\\\\\\\\\\\\\\\\\\:\r\n~@
2)搜索该字符,然后继续按F3键,直到看到损坏的字符。通常类似于“è”,是“a”的腐败版本

3)删除这些字符或将其替换为应该的字符


清除所有损坏字符后,您将能够将文档转换为其他编码

只是添加到@Draken响应:这是添加了西班牙语字符的正则表达式


在我的例子中,我点击了Ctrl+H(用于替换),作为替换表达式,没有使用任何内容。因此,所有内容都被超快速清除,我可以使用ISO-8859-1

保存它。对于Linux用户,还可以使用命令iconv自动删除损坏的字符:

iconv -f UTF-8 -t Windows-1251 -c < ~/temp/data.csv > ~/temp/data01.csv
iconv-f UTF-8-t Windows-1251-c<~/temp/data.csv>~/temp/data01.csv

-c在遇到无法转换的字符时,会自动放弃这些字符,而不是终止这些字符。

在我的情况下,这不起作用。当我从工作中粘贴时(即使是标准的英文字符),有时编码会发生变化,导致问题的字符不可见。这对我来说非常有效。这是包含德语重音字符的RegExp。也许你想编辑你的帖子,@Draken:
[^a-zA-Z0-9-\.]/='{}\[\]\\\\\\\\\\\\\\\\\\\\\\\:\r\n~@cf\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\:\r\n~\\\\\\