搜索引擎将如何应对不同的unicode?

搜索引擎将如何应对不同的unicode?,unicode,character-encoding,fonts,seo,search-engine,Unicode,Character Encoding,Fonts,Seo,Search Engine,我正在开发一个格鲁吉亚语网站。格鲁吉亚字母表有自己的Unicode范围,但也有一些特殊字体,用格鲁吉亚字形代替英文字符,有点像“符号”和“丁巴茨”字体 例如,字符串“saqarTvelo”将呈现为“საქართველო" 使用这些字体。所以现在我有两个选择,不知道该怎么办: 在我的网站上使用格鲁吉亚Unicode,但问题是所有字体都是为英语Unicode创建的,不能使用格鲁吉亚Unicode 使用英文Unicode的格鲁吉亚字体。但我不知道搜索引擎会有什么反应 请告诉我该怎么做,我累坏了!简单的

我正在开发一个格鲁吉亚语网站。格鲁吉亚字母表有自己的Unicode范围,但也有一些特殊字体,用格鲁吉亚字形代替英文字符,有点像“符号”和“丁巴茨”字体

例如,字符串“saqarTvelo”将呈现为“საქართველო" 使用这些字体。所以现在我有两个选择,不知道该怎么办:

  • 在我的网站上使用格鲁吉亚Unicode,但问题是所有字体都是为英语Unicode创建的,不能使用格鲁吉亚Unicode

  • 使用英文Unicode的格鲁吉亚字体。但我不知道搜索引擎会有什么反应


  • 请告诉我该怎么做,我累坏了!

    简单的回答是,使用选项1中的方法,搜索引擎将看到“搜索”一词საქართველო” 在您的文本中显示为“saqarTvelo”,因此正常搜索将失败

    这个问题似乎涉及到在网页上使用格鲁吉亚字母的两种不同方式:

  • 使用Unicode编码,因此字符将使用Unicode编码字体呈现(这是大多数字体的特点,但大多数字体不包含格鲁吉亚字母)
  • 使用非标准的“专用”编码,通常将256个不同的代码位置(8位组合)映射到某些目的所需的任何字符。这假定文本使用相同编码方式的字体呈现
  • 方法2可以描述为a,但它从早期开始就在web上使用(即使CSS不可用,人们不得不求助于
    来设置字体),尤其是在早期。除非用户的计算机具有特定的“私人”编码字体,否则它真的不起作用(或者某些字体的编码方式完全相同)。由于搜索引擎不区分字体,它们只会看到8位代码,并尝试在页面声明或暗示的编码中解释它们,而不是在“私有”编码中解释它们(不能声明,因为它没有已发布的定义、标准名称或任何名称)

    方法1的问题是,要使其工作,用户的计算机需要一些(Unicode编码的字体)来支持所使用的字符。现在,使用可下载字体(web字体)可以很好地解决这一问题通过
    @font-face
    。包括一些有用的免费字体,如DejaVu字体、GNU Freefont字体和Quivira。有关此方法的更多信息,请参阅我的


    使用方法1,搜索引擎将正确地看到格鲁吉亚字母,前提是文档的编码(通常为UTF-8)已正确声明或可由搜索引擎推断。

    Georgian没有“自己的Unicode”。只有一个Unicode(线索在名称中!),对每个人都一样。@Kerrek SB你是什么意思?如果我想搜索这个词”საქართველო“谷歌会显示我的网站吗?即使只有“saqarTvelo”这个词”საქართველო“但只限于字体。@KerrekSB:指责他糟糕的英语技能无济于事。他的问题就像旧的“符号”和“小蝙蝠”的问题一样"对其他符号重复使用ASCII范围的字体。这在Unicode被接受之前不使用拉丁语的语言中非常常见。我投票结束这个问题,因为SEO主题不在主题中。我计划使用格鲁吉亚字体,但字符设置为英语Unicode,所以c你能告诉我我可以用哪个程序将unicode从英语改为格鲁吉亚语吗?没有“英语unicode”和“格鲁吉亚unicode”之分。你只需使用一个程序,让你输入格鲁吉亚语字符并将其保存为unicode编码(实际上是UTF-8编码)。如果你的数据现在是“私有”的编码依赖于特定的私有编码字体进行呈现,然后需要该字体的文档,然后可以编写一个简单的表驱动转换器。