如何使用unicode检索/解码html utf-8字符?

如何使用unicode检索/解码html utf-8字符?,html,unicode,utf-8,decode,font-face,Html,Unicode,Utf 8,Decode,Font Face,当我尝试访问任何与unicode集成的网站时हिंदी 然后在浏览器中显示包含类似。。。 ¤ªà¤•à¥�षी à¤•à¥‡ à¤ªà¤¾à¤¸ à¤µà¥‹à¤¸à¤¾à¤°à¥€ à¤¸à¥�ख à¤¸à¥�विधाà¤�à¤� 一个,一个,一个,一个 如何解码此字符并将其转换为纯unicode?这是UTF-8编码的Devanagari,错误地显示为Windows-1252。如果你改变方向,例如 piconv -f utf-8 -t windows-1252 -s

当我尝试访问任何与unicode集成的网站时हिंदी 然后在浏览器中显示包含类似。。。 ¤ªà¤•à¥�षी à¤•à¥‡ à¤ªà¤¾à¤¸ à¤µà¥‹à¤¸à¤¾à¤°à¥€ à¤¸à¥�ख à¤¸à¥�विधाà¤�à¤� 一个,一个,一个,一个


如何解码此字符并将其转换为纯unicode?

这是UTF-8编码的Devanagari,错误地显示为Windows-1252。如果你改变方向,例如

piconv -f utf-8 -t windows-1252 -s '¤ªà¤•à¥�षी के पास वोसारी सà¥�ख सà¥�विधाà¤�à¤� हैं, जो उनके जà'
然后您可以取回部分原始文本:

��क��?षी के पास वोसारी स��?ख स��?विधा��?��? हैं, जो उनके ज�
你的复制粘贴操作使这里的解码有损。将输入重定向到文件中,而不是复制粘贴,这样就不会引入任何缺陷


附带Perl

� 表示将字节解码为文本时使用了错误的字符编码。从那一点上讲,原文是不可恢复的。您必须使用字符编码(而不是编写器使用的编码)向上游读取任何内容。我希望这有帮助。你的问题不清楚。请