Python 将包含合并分录的文本转换为utf-8

Python 将包含合并分录的文本转换为utf-8,python,unicode,utf-8,Python,Unicode,Utf 8,我们有一些包含德语元音的文本,使用例如“a”+组合分词表示 ($cc$88) 你知道如何将这些文本正确地转换为utf8吗?首先,如果它还不是unicode,那么就对它进行解码。第二第三,编码。具体来说,如果您要输出它,您希望它是NFC格式的。NFD更常用于内部。所以你有两个代码点,或者你有一些编码形式?将字符输出到UTF-8流,并对其进行编码。但看看伊格纳西奥关于正常化的回答。你可能想正常化为NFC。

我们有一些包含德语元音的文本,使用例如“a”+组合分词表示 ($cc$88)


你知道如何将这些文本正确地转换为utf8吗?

首先,如果它还不是unicode,那么就对它进行解码。第二第三,编码。

具体来说,如果您要输出它,您希望它是NFC格式的。NFD更常用于内部。所以你有两个代码点,或者你有一些编码形式?将字符输出到UTF-8流,并对其进行编码。但看看伊格纳西奥关于正常化的回答。你可能想正常化为NFC。