Html 这个西里尔文脚本的源格式是什么?

Html 这个西里尔文脚本的源格式是什么?,html,character-encoding,format,cyrillic,Html,Character Encoding,Format,Cyrillic,我正在编辑一个网页,其可见文本为俄语,编码设置为UTF-8。顺便说一句,我不会说俄语。因此,我的目标是将浏览器中呈现的西里尔文复制并粘贴到这些页面的新编辑版本的html源代码中。我发现这不起作用,我正在粘贴一行问号(“???????”)。我不明白为什么会这样,但这是主要问题的附带问题,即这种源代码格式叫什么(与此相关,我如何从它呈现的西里尔文中复制它)。让我举个例子。俄语单词“职业”或“工作”的html源代码如下所示: ÐÐÐÐÐÐÐÐÐÐÐŒ½Ðи/ÐÐÐÐŒ 当html页面在浏览器中呈现该

我正在编辑一个网页,其可见文本为俄语,编码设置为UTF-8。顺便说一句,我不会说俄语。因此,我的目标是将浏览器中呈现的西里尔文复制并粘贴到这些页面的新编辑版本的html源代码中。我发现这不起作用,我正在粘贴一行问号(“???????”)。我不明白为什么会这样,但这是主要问题的附带问题,即这种源代码格式叫什么(与此相关,我如何从它呈现的西里尔文中复制它)。让我举个例子。俄语单词“职业”或“工作”的html源代码如下所示:

ÐÐÐÐÐÐÐÐÐÐÐŒ½Ðи/ÐÐÐÐŒ

当html页面在浏览器中呈现该页面时,它看起来如下所示:

а

我的目标是复制俄文西里尔文文本并将其成功粘贴到新页面中,使其看起来像第一种格式。有人能告诉我第一种格式叫什么吗?还有没有一种方法我可以用第二种格式作为输入来“逆向工程”第一种格式

谢谢。

找一个更好的编辑

如果你在Windows上,记事本++很好。只需将其切换到UTF-8并仅使用该选项

格式:

ÐÐÐÐÐÐÐÐÐÐÐŒ½Ðи/ÐÐÐÐŒ


被称为垃圾。

这里的答案似乎与许多传统Windows程序仍然使用西里尔文脚本的非Unicode表示有关。诸如“西里尔字母Windows-125”和大约六种变体之类的替代品。他们“回到过去”完成了任务,但无法很好地使用Unicode表示。在过去的几天里,我做了比以前更多的挖掘,发现了关于这个问题的讨论。我想感谢Karol S为我指出Dreamweaver文档的正确方向。这让我提出了正确的问题。我引用的链接继续指定Dreamweaver的某些版本确实使用非Unicode表示。我使用的是Dreamweaver4,这几天它已经很旧了


为完整起见,尽管神秘格式(如上)没有确切的名称,但可以恰当地描述为“编码为‘西方(拉丁语1)’字符的西里尔字母”。就编码保存数据而言,这种表示方式“有效”,并且这种数据可以通过现代浏览器正确地以西里尔字母表示,但它是一种传统的表示方式,因为现在更常用Unicode。

复制和粘贴中发生的情况取决于数据和使用的程序。这不是一个编码问题。现在还不清楚为什么你会这样做,从页面复制文本到HTML格式,而不是仅仅编辑HTML格式。是的,我知道这“取决于”,但不幸的是,这对我没有帮助。我也没有说这是一个“编码问题”;这是关于数据的格式。为什么我不编辑原稿太复杂了,这里无法描述,只是如果有替代方案——从第二种格式中导出(尚未确定)第一种格式——它效率低下而且太耗时。这显然不是垃圾,因为它是西里尔文的来源。编辑是Dreamweaver,我认为它比记事本有点先进。谢谢你,这很有用!