Php 文档破坏文本

Php 文档破坏文本,php,dom,domdocument,Php,Dom,Domdocument,我有一些西里尔文的文本:Саааааааа,但在 $dom = new DOMDocument('1.0', 'utf-8'); $dom->loadHTML('Сегодня мы делали анонс'); 然后我就跑 $dom->saveHTML(); 我收到С&以太&微型&以太³&以太&骨折34例&以太&急性的&以太 如何解决此问题?调用loadHTML时,将覆盖DOMDocument构造函数中的编码集。相反,需要在加载的HTML内容中指定:

我有一些西里尔文的文本:Саааааааа,但在

$dom = new DOMDocument('1.0', 'utf-8');
$dom->loadHTML('Сегодня мы делали анонс');
然后我就跑

$dom->saveHTML();
我收到С&以太&微型&以太³&以太&骨折34例&以太&急性的&以太


如何解决此问题?

调用loadHTML时,将覆盖DOMDocument构造函数中的编码集。相反,需要在加载的HTML内容中指定:

<?php

$dom = new DOMDocument();
$dom->loadHTML('<meta charset="utf-8">Сегодня мы делали анонс'); // specify the input encoding

$dom->encoding = 'UTF-8'; // set the output encoding
print $dom->saveHTML($dom->documentElement);

// [...] <p>Сегодня мы делали анонс</p> [...]