Html 如何使用Google translate翻译静态web内容

Html 如何使用Google translate翻译静态web内容,html,language-translation,Html,Language Translation,我们有一个完全由英语静态内容组成的网站。 该网站的HTML文件总量约为300MB,不包括图像,仅HTML文本文件 对于没有互联网可用性的偏远地区学校,这些内容通常在简单的web服务器设备中离线使用 如果我从互联网上的Web服务器上提供相同的内容,并给出Google Translate网站的URL,这将是一个非常好的翻译结果,我们可以通过链接绕过该网站,就像在原文中一样 因此,我们知道谷歌翻译将在翻译内容方面做得很好,并通过在线谷歌翻译服务自动完成 我的问题是如何最好地使用谷歌翻译服务或其他类似服

我们有一个完全由英语静态内容组成的网站。 该网站的HTML文件总量约为300MB,不包括图像,仅HTML文本文件

对于没有互联网可用性的偏远地区学校,这些内容通常在简单的web服务器设备中离线使用

如果我从互联网上的Web服务器上提供相同的内容,并给出Google Translate网站的URL,这将是一个非常好的翻译结果,我们可以通过链接绕过该网站,就像在原文中一样

因此,我们知道谷歌翻译将在翻译内容方面做得很好,并通过在线谷歌翻译服务自动完成

我的问题是如何最好地使用谷歌翻译服务或其他类似服务,将HTML文件批量翻译成其他几种语言

翻译显然必须识别HTML,只翻译实际的英语内容,在线谷歌翻译服务做得很好

这似乎是一个相当普遍的要求,但我找不到一个简单的答案来解决这个问题

如有任何建议,我将不胜感激


提前谢谢。

谢谢你的建议

如果一个接一个地将文件提交到GoogleAPI,并返回标记不变且内容已翻译的文件,则会很好地工作

但我认为,每种语言的翻译成本约为6000美元,即每200万字符X 300 MB数据。我们至少需要三种语言的翻译。如此接近2万美元——对于一个基于社区的、完全自愿参与的项目来说,可能有点超出了上限,即使通过一些巧妙的编码进行了一些削减

js为内部翻译内容提供无限的免费机器翻译。所以这看起来是值得跟进的


我们需要的一种语言是高棉语,所以我想看看他们的100种语言列表中是否包括高棉语,我还没有在他们的网站上发现这些语言。

Google translate忽略html标记,你只需将文件发送到他们的API即可。该API只需花费2000美元/百万个字符,因此整个站点的成本可能在500-750美元之间。您可以编写一个sax风格的html解析器,通过将数据发送到api来处理数据,从而将其一分为二