PHP语言与字符编码

PHP语言与字符编码,php,character-encoding,Php,Character Encoding,我正在使用PHP tidy,如下所示: $config = array( 'wrap' => 0, 'lower-literals' => 1, 'preserve-entities' => 1, 'drop-empty-paras'

我正在使用PHP tidy,如下所示:

$config = array(
                'wrap'                         => 0,
                'lower-literals'               => 1,
                'preserve-entities'            => 1,
                'drop-empty-paras'             => 0
                );

$tidy = new tidy;

$tidy->parseString($html, $config, 'utf8');

$tidy->cleanRepair();
当我用英文文本传递HTML时,结果很好。然而,法语文本,它的编码有问题。因此,如果我传递像
vérifier
这样的消息,那么它在输出中显示为
vérifier
。我怎样才能保持整洁,使自己能很好地使用所有语言,至少是拉丁语


此外,我将把tidy的输出传递到PHP的DOM文档,这里有什么需要注意的吗?

看起来UTF-8处理很好,但是您正在用拉丁语-1而不是UTF-8解释结果。设置适当的HTTP头或元标记,指示浏览器使用UTF-8读取文档

header('Content-Type:text/html; charset=utf-8');

看起来UTF-8处理很好,但是您用拉丁语-1而不是UTF-8来解释结果。设置适当的HTTP头或元标记,指示浏览器使用UTF-8读取文档

header('Content-Type:text/html; charset=utf-8');

其实你是对的。是我的谷歌语法荧光笔导致了这个问题!更具体地说,就是它的
htmlentities
,这就是问题所在,这样我可以在
pre
标记中显示HTML。@Abs
htmlentities
将字符集作为其第三个参数,您可能想试试。实际上您是对的。是我的谷歌语法荧光笔导致了这个问题!更具体地说,就是它的
htmlentities
,这就是问题所在,这样我就可以在
pre
标记中显示HTML。@Abs
htmlentities
将字符集作为它的第三个参数,您可能想试试。