Encoding 对于ã,相同UTF-8字符的不同编码结果;

Encoding 对于ã,相同UTF-8字符的不同编码结果;,encoding,utf-8,Encoding,Utf 8,一种编码方案将ã作为%CC%83给出,另一种编码方案将ã作为%C3%a3给出 这二者有什么区别?我调试了这个,发现,a%CC%83实际上是2个字符。一个用于~,即%CC%83,另一个用于a。但是,人们如何获得这种编码呢?这是正常的行为。在Unicode中,同一符号可以编码为单个字符,也可以编码为两个或多个字符的组合 但是,组合一不适合我们。如何禁用它。我希望编码为单个字符only@VivekVardhan,您使用的是什么编程语言?您需要进行Unicode规范化才能具有预合成字符,但请注意,并非所

一种编码方案将
ã作为%CC%83
给出,另一种编码方案将
ã作为%C3%a3
给出


这二者有什么区别?我调试了这个,发现,
a%CC%83
实际上是2个字符。一个用于
~
,即
%CC%83
,另一个用于
a
。但是,人们如何获得这种编码呢?

这是正常的行为。在Unicode中,同一符号可以编码为单个字符,也可以编码为两个或多个字符的组合


但是,组合一不适合我们。如何禁用它。我希望编码为
单个字符
only@VivekVardhan,您使用的是什么编程语言?您需要进行Unicode规范化才能具有预合成字符,但请注意,并非所有分解的字符都具有其预合成的等效字符。我们正在收到来自Android应用程序的请求,该应用程序正以这种方式编码。对Lucene的查询并没有给出合成编码的结果,而是给出了正常编码(单字符编码)的正确结果,但对于相同的ios,它发送单字符编码的值