Php 如何确定网站的语言

Php 如何确定网站的语言,php,html-parsing,Php,Html Parsing,我有一个网站的url,需要找出该网站使用的语言(无论是西班牙语、法语、意大利语等) 该网站的顶级域名是.com,这一点都没有帮助。我不能简单地检查字符串是否包含“.de”、““.fr”或任何其他国家/地区代码 我试图获得html标签的lang属性,但是有很多网站没有它。我还发现我可以检查meta标记,它看起来像这样: <meta name="language" content="english"> 但是,并不是所有的网站都使用这个标签 你知道确定网站语言的其他方法吗 谢谢。遗憾

我有一个网站的url,需要找出该网站使用的语言(无论是西班牙语、法语、意大利语等)

该网站的顶级域名是.com,这一点都没有帮助。我不能简单地检查字符串是否包含“.de”、““.fr”或任何其他国家/地区代码

我试图获得
html
标签的
lang
属性,但是有很多网站没有它。我还发现我可以检查meta标记,它看起来像这样:

<meta name="language" content="english">

但是,并不是所有的网站都使用这个标签

你知道确定网站语言的其他方法吗


谢谢。

遗憾的是,许多开发人员并不认为在他们的网页中添加语言元信息是有用的。还有可能是页面上有多种语言,据我所知,这些语言强制使用
参数
lang
或其他类似的东西。以下是一些可能对您有所帮助的建议:

  • 检查
    标记
  • 检查
    s内部,看看是否包含
    lang
    参数
  • 检查菜单(如果有)-这些菜单通常包含比页面主体少得多的文本
  • 寻找更小的HTML数据块,您可以轻松解析这些数据块,从而获得有关页面使用的语言的更多信息
  • 最后开始试探性地分析大文本块

  • 事实上,目前的情况真的很糟糕,因为提供这样的信息并不困难,也不需要投入太多的额外时间,但其优点肯定是存在的,尤其是在搜索引擎方面,最重要的是,提高了各种残疾人士的可访问性。

    可以使用google translate、microsoft translate或languagelayer等服务进行语言文本检测


    我浏览了这些API文档、限制和价格,选择了languagelayer personnaly,因为它是最便宜的,而且看起来更容易使用。

    仅通过分析文本。这不是一件小事,你自己做。除了使用某种语言检测算法,没有简单的方法来确定网站的语言。可能有一些SaaS提供商专门从事这方面的工作;谷歌是你的朋友,没有单一可靠的方法。你必须应用一种启发式方法,对几个标记进行几次测试,然后计算语言的概率。好的,明白了。我现在只想使用meta-tag和lang属性是的,很多开发人员忽视了语言元数据,这是一个遗憾。