C#-韩语编码
这可能与其他韩语编码问题不同 有一个网站,我必须刮,这是韩国 他们网站上的一个例子是 "개인정보보호를 위해 뒤로가기 버튼 대신 검색결과 화면 상단과 하단의 이전 버튼을 사용하시기 바랍니다." 我正在使用HttpWebRequest和HttpWebResponse来抓取站点 这就是我检索html的方式 --部分代码-- 现在我的问题是,我没有得到正确的韩文字符。在我的“code”变量中,我将代码页建立在MSDN中(让我缩小范围) 以下是韩国代码页: 5194950252520949208331003949C#-韩语编码,c#,C#,这可能与其他韩语编码问题不同 有一个网站,我必须刮,这是韩国 他们网站上的一个例子是 "개인정보보호를 위해 뒤로가기 버튼 대신 검색결과 화면 상단과 하단의 이전 버튼을 사용하시기 바랍니다." 我正在使用HttpWebRequest和HttpWebResponse来抓取站点 这就是我检索html的方式 --部分代码-- 现在我的问题是,我没有得到正确的韩文字符。在我的“code”变量中,我将代码页建立在MSDN中(让我缩小范围) 以下是韩国代码页: 519495025252094920
但是我仍然没有得到正确的韩语字符?你认为问题出在哪里?很可能页面不是采用特定的韩语编码,而是采用Unicode编码 尝试
Encoding.UTF8
,编码。默认值为(UTF-16),而不是特定的代码页。还有编码.UTF7
和编码.UTF32
,但它们并不常见
可以肯定的是,检查服务器返回的内容类型的元标记和头
更新(从Comments中收集):
由于内容类型标题为EUC-KR
,因此相应的代码页为51949,这是检索页面所需的内容
不清楚您是否正在将其写入文件-您在写入文件时需要使用相同的编码,或者将字节[]
从原始文件转换为输出文件编码(使用)。虽然存在完全相同的问题,但我已经用下面的代码完成了它:
Encoding.UTF8.GetString(DownloadData(URL));
这会直接将WebClient GET请求的输出转换为UTF8编码。页面采用什么编码?它有任何元标记吗?http头呢?它只是头EUC-KR,但我已经使用了名称encoding.GetEncoding(“EUC-KR”),但仍然使用了错误的韩文字符?踰?踰?寃쎈ℓ?蹂????댁?? ?ㅼ寃? ???⑸?? 媛?몄蹂대낫?몃? ????ㅻ?媛湲?踰???? 寃?寃곌낵 ?硫???④낵 ??⑥ ?댁 踰?쇱 ?ъ⑺?湲?諛????你有没有在进行清理的计算机上安装代码页?@reach4thelasers-没有必要。他们有核武器,你知道。@reach4thelasers LOL。我想在朝鲜,他们没有。这是内容类型标题“内容类型:text/html;charset=EUC-KR“当我使用默认值时,我得到了这个”쨈챘쨔첵쩔첩쨔첵쩔첩째챈쨍??짚쨘쨍 ?짢?채???철쩔징 쩔?쩍?째??쨩 ?짱쩔쨉??쨈?쨈?. 째쨀???짚쨘쨍쨘쨍?짙쨍짝 ?짠?? 쨉?쨌?째징짹창 쨔철?째 쨈챘쩍? 째?쨩철째찼째첬 ?짯쨍챕 쨩처쨈?째첬 ??쨈??? ???체 쨔철?째?쨩 쨩챌쩔챘??쩍?짹창 쨔?쨋첩쨈?쨈?.“------这是UTF 8”占쏙옙占쏙옙占쏙옙占쏙옙占쏙옙占쏙옙占쏙옙占“----UTF7与默认值相同----UTF32根本不起作用----Unicode崩溃了我的N++----JaysonRagasa-您如何保存文件?使用相同的编码?51949这是我尝试的第一件事我知道这是正确的代码页,但我得到的是这是一个不同的字符再次加上网站刚刚进入维护模式。。该死,等网站恢复正常后我会再看的。我想这是我的问题。英雄联盟
Encoding.UTF8.GetString(DownloadData(URL));