Utf 8 为什么同时使用MultiByteToWideChar和WideCharToMultiByte?

Utf 8 为什么同时使用MultiByteToWideChar和WideCharToMultiByte?,utf-8,Utf 8,我看到一些代码如下: 为什么同时使用MultiByteToWideChar和WideCharToMultiByte char szLine[MAX_LENGTH_STRING] = {0} ... //some operate to szLine char *szUtf8string; wchar_t *szUnicodeString; int size; int room; size = strlen(szLine)+1; room = MultiByteToWideChar(CP_ACP,

我看到一些代码如下: 为什么同时使用MultiByteToWideChar和WideCharToMultiByte

char szLine[MAX_LENGTH_STRING] = {0}
... //some operate to szLine
char *szUtf8string;
wchar_t *szUnicodeString;
int size;
int room;
size = strlen(szLine)+1;
room = MultiByteToWideChar(CP_ACP, 0, szLine, -1, NULL, 0);
szUnicodeString = (wchar_t*) malloc((sizeof(wchar_t))*room);
MultiByteToWideChar(CP_ACP, 0, szLine, -1, szUnicodeString, room);

room = WideCharToMultiByte(CP_UTF8, 0, szUnicodeString, -1, NULL, 0, NULL, NULL);
szUtf8string = (char*) malloc(room);
WideCharToMultiByte(CP_UTF8, 0, szUnicodeString, -1, szUtf8string, room, NULL, NULL);

此代码片段首先使用系统默认代码页将字符串从多字节表示形式转换为Unicode,然后将其转换为UTF-8多字节表示形式。因此,它将默认代码页中的文本转换为UTF-8表示形式


代码是脆弱的,因为它假设UTF-8版本的大小只会增加一倍(这可能在大多数情况下都有效,但更糟糕的情况是默认代码页中的一个字节可能映射到UTF-8中的4个字节)

此代码片段首先使用系统默认代码页将字符串从多字节表示形式转换为Unicode,然后将其转换为UTF-8多字节表示形式。因此,它将默认代码页中的文本转换为UTF-8表示形式


代码是脆弱的,因为它假设UTF-8版本的大小只会增加一倍(这可能在大多数情况下都有效,但更糟糕的情况是默认代码页中的一个字节可能映射到UTF-8中的4个字节)

您好,谢谢,我已经根据您的建议更新了代码,您能帮我检查一下是否可以吗?如果我使用vsnprintf(…)打印“szUtf8string”,它将在vsnprintf处崩溃。您好,谢谢,我已经根据您的建议更新了代码,您能帮我检查一下它是否正常吗?如果我使用vsnprintf(…)打印“szUtf8string”,它将在vsnprintf处崩溃。