Character encoding 崇高的文本：不具有代表性的字符_Character Encoding_Sublimetext2_Sublimetext_Sublimetext3

Character encoding 崇高的文本：不具有代表性的字符

character-encoding sublimetext2 sublimetext3

Character encoding 崇高的文本：不具有代表性的字符,character-encoding,sublimetext2,sublimetext,sublimetext3,Character Encoding,Sublimetext2,Sublimetext,Sublimetext3,我使用升华文本作为Latex，所以我需要使用特定的编码。但是，在某些情况下，当我粘贴从其他程序（大多数情况下是word/浏览器）复制的文本时，我会收到以下消息： "Not all characters are representable in XXX encoding, falling back to UTF-8" 我的问题是：有没有办法看到文本的哪些部分无法编码，这样我就可以手动删除它们？我遇到了这个问题。它是由文档中的损坏字符引起的。下面是我如何解决它的 1）在文档中搜索所有标准字符。确保

我使用升华文本作为Latex，所以我需要使用特定的编码。但是，在某些情况下，当我粘贴从其他程序（大多数情况下是word/浏览器）复制的文本时，我会收到以下消息：

"Not all characters are representable in XXX encoding, falling back to UTF-8"

我的问题是：有没有办法看到文本的哪些部分无法编码，这样我就可以手动删除它们？

我遇到了这个问题。它是由文档中的损坏字符引起的。下面是我如何解决它的

1）在文档中搜索所有标准字符。确保在搜索中启用正则表达式，然后粘贴以下内容：

[^a-zA-Z0-9 -\.;<>/ ={}\[\]\^\?_\\\|:\r\n@]

[^a-zA-Z0-9-\.；/={}\[\]\^？\\\\\\\\\\\\\\\\\\：\r\n@]

您可以添加您的语言的正常重音字符，这里是法语和德语的字符。例如等：

[^a-zA-Z0-9 -\.;<>/ ='{}\[\]\^\?_\\\|:\r\n~@éàèêîôâûçäöüÄÖÜß]

[^a-zA-Z0-9-\.；/='{}\[\]\\\\\\\\\\\\\\\\\\\\\\\\\\\\：\r\n~@

2）搜索该字符，然后继续按F3键，直到看到损坏的字符。通常类似于“Ã¨”，是“a”的腐败版本

3）删除这些字符或将其替换为应该的字符

清除所有损坏字符后，您将能够将文档转换为其他编码

只是添加到@Draken响应：这是添加了西班牙语字符的正则表达式


在我的例子中，我点击了Ctrl+H（用于替换），作为替换表达式，没有使用任何内容。因此，所有内容都被超快速清除，我可以使用ISO-8859-1
保存它。对于Linux用户，还可以使用命令iconv自动删除损坏的字符：
iconv -f UTF-8 -t Windows-1251 -c < ~/temp/data.csv > ~/temp/data01.csv

iconv-f UTF-8-t Windows-1251-c<~/temp/data.csv>~/temp/data01.csv

-c在遇到无法转换的字符时，会自动放弃这些字符，而不是终止这些字符。
在我的情况下，这不起作用。当我从工作中粘贴时（即使是标准的英文字符），有时编码会发生变化，导致问题的字符不可见。这对我来说非常有效。这是包含德语重音字符的RegExp。也许你想编辑你的帖子，@Draken:[^a-zA-Z0-9-\.]/='{}\[\]\\\\\\\\\\\\\\\\\\\\\\\：\r\n~@cf\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\：\r\n~\\\\\\