C中java.text.Normalizer.Form.NFD和utf8 proc之间的编码问题

C中java.text.Normalizer.Form.NFD和utf8 proc之间的编码问题,java,c,character-encoding,Java,C,Character Encoding,我想知道在Java中处理德语、日语、韩语中的特殊字符(如β)和C中的utf8时是否存在问题 我们在java端使用java.text.Normalizer.Form.NFD,并将字符串传递给DB,在DB中我们使用C中的自定义函数来规范化字符串。我们遇到了名称有升序和特殊字符的问题。例如:如果名称有ÄßÜ,则在规范化后DB在用于规范化的C函数中将其更改为“assu” 这是C中UTF8的问题还是Java和C规范化程序函数之间的不匹配。我们应该如何处理这些特殊字符。尝试使用normalizer.Form

我想知道在Java中处理德语、日语、韩语中的特殊字符(如β)和C中的utf8时是否存在问题

我们在java端使用java.text.Normalizer.Form.NFD,并将字符串传递给DB,在DB中我们使用C中的自定义函数来规范化字符串。我们遇到了名称有升序和特殊字符的问题。例如:如果名称有ÄßÜ,则在规范化后DB在用于规范化的C函数中将其更改为“assu”


这是C中UTF8的问题还是Java和C规范化程序函数之间的不匹配。我们应该如何处理这些特殊字符。

尝试使用normalizer.Form.NFC或normalizer.Form.NFKC,您可以找到其他信息。

什么是“ust8proc”或“UTF8proc”?这是一个输入错误及其UTF8proc函数来自何处?据我所知,它不在标准C库中。