C# 将韩文文本转换为Unicode

C# 将韩文文本转换为Unicode,c#,unicode,cjk,C#,Unicode,Cjk,我想问的事情很简单。我有一个HTML文档,它托管在webbrowser控件中 现在,当我使用MSHTML range属性选择一个韩语单词时,我能够 range.htmlText和range.Text。它们都显示了韩语单词。我只想把它转换成unicode格式 可能吗 仅供参考,我正在使用C WinForms进行所有这些操作。您能提供更多信息吗?当你读韩语单词时,它是什么格式的?我假设与HTML文档头相同。你能发布一个你试图阅读的HTML页面示例吗 如果问题是您获取的字符串位于不同的代码页中,则可以

我想问的事情很简单。我有一个HTML文档,它托管在webbrowser控件中

现在,当我使用MSHTML range属性选择一个韩语单词时,我能够 range.htmlText和range.Text。它们都显示了韩语单词。我只想把它转换成unicode格式

可能吗


仅供参考,我正在使用C WinForms进行所有这些操作。

您能提供更多信息吗?当你读韩语单词时,它是什么格式的?我假设与HTML文档头相同。你能发布一个你试图阅读的HTML页面示例吗

如果问题是您获取的字符串位于不同的代码页中,则可以使用.Net中的编码类对其进行转换。例如,您的文本可能是iso-2022-kr格式。下面是一个转换字符串的示例,在下面的代码中称为stringInKoreanIsoEncoding:

Encoding koreanEncoding = Encoding.GetEncoding(50225); // 50225 is the code page for iso-2022-kr
byte[] convertedToUtf8 = Encoding.Convert(koreanEncoding, Encoding.UTF8, koreanEncoding.GetBytes(stringInKoreanIsoEncoding));
string utf8String = Encoding.UTF8.GetString(convertedToUtf8);

你能提供更多的信息吗?当你读韩语单词时,它是什么格式的?我假设与HTML文档头相同。你能发布一个你试图阅读的HTML页面示例吗

如果问题是您获取的字符串位于不同的代码页中,则可以使用.Net中的编码类对其进行转换。例如,您的文本可能是iso-2022-kr格式。下面是一个转换字符串的示例,在下面的代码中称为stringInKoreanIsoEncoding:

Encoding koreanEncoding = Encoding.GetEncoding(50225); // 50225 is the code page for iso-2022-kr
byte[] convertedToUtf8 = Encoding.Convert(koreanEncoding, Encoding.UTF8, koreanEncoding.GetBytes(stringInKoreanIsoEncoding));
string utf8String = Encoding.UTF8.GetString(convertedToUtf8);