Jak zachować język chiński lub inny język obcy tak, jak są, zamiast konwertować je na kody?

DOMDocument wydaje się, że konwertuje chińskie znaki na kody, na przykład,

的 的 乱发 stanie sięä½ çš„ä¹±å‘

Jak mogę zachować język chiński lub inny język obcy tak, jak są, zamiast konwertować je na kody?

Poniżej jest mój prosty test,

$dom = new DOMDocument();
$dom->loadHTML($html);

Jeśli dodam to poniżej przed loadHTML (),

$html = mb_convert_encoding($html, "HTML-ENTITIES", "UTF-8"); 

Dostaję,

你的乱发

Nawet jeśli ukryte kody będą wyświetlane jako chińskie znaki,你的乱发 nadal nie są你的乱发 czym jestem po ....