Localization 如何确定每个mime 1.0电子邮件的区域设置

Localization 如何确定每个mime 1.0电子邮件的区域设置,localization,smtp,mime-types,mime,Localization,Smtp,Mime Types,Mime,是否可以确定电子邮件(MIME 1.0)的区域设置(语言)?我正在处理的特定用例是,尝试区分每封电子邮件中的特定区域设置,然后根据自定义smtp服务器进行相应的翻译。查看内容类型标头的字符集值。除非是UTF-8,否则您通常可以了解电子邮件的编写语言 这有帮助吗?没有可靠的方法,但在某些情况下,像libtextcat这样的语言猜测者的精确度就足够了 如果沿着这条路线走下去,请注意,libtextcat附带了一组非常粗糙的语言模型,这些模型基本上只是概念证明。LibreOffice维护一个forkl

是否可以确定电子邮件(MIME 1.0)的区域设置(语言)?我正在处理的特定用例是,尝试区分每封电子邮件中的特定区域设置,然后根据自定义smtp服务器进行相应的翻译。

查看内容类型标头的字符集值。除非是UTF-8,否则您通常可以了解电子邮件的编写语言


这有帮助吗?

没有可靠的方法,但在某些情况下,像
libtextcat
这样的语言猜测者的精确度就足够了


如果沿着这条路线走下去,请注意,
libtextcat
附带了一组非常粗糙的语言模型,这些模型基本上只是概念证明。LibreOffice维护一个fork
libexttextcat
,该fork具有适当的语言模型,但仅适用于Unicode。创建自己的语言模型也不是很难。

thx供您回复。还有什么其他价值观?我所见过的唯一一个关于内容类型的=“多部分/备选方案;或内容类型:多部分/备选;边界=047d7b6dd0b4e9d04104ef8f7021。所以没有utf8,但这两条消息实际上是我们的。刚刚看到你的评论。该内容类型标题表示您的消息由可选部分组成。您需要再深入一层,查看子部分的内容类型。诸如US-ASCII或ISO-8859-1之类的流行字符集用于多种语言,包括许多它们实际上并不适合的语言(出于历史原因,或者因为用户无法或不允许对其进行正确配置)。类似地,Exchange的最新版本似乎加入了一个X-Accept-Language:header,它反映了服务器的配置,而不是用户的偏好。