Como manter os chineses ou outros idiomas estrangeiros como eles são, em vez de convertê-los em códigos?
DOMDocument
parece converter caracteres chineses em códigos, por exemplo,
你 的 乱发 se tornaráä½ çš„ä¹±å‘
Como posso manter os chineses ou outras línguas estrangeiras como eles são, em vez de convertê-los em códigos?
Abaixo está meu teste simples,
<code>$dom = new DOMDocument(); $dom->loadHTML($html); </code>
Se eu adicionar isso abaixo antes de loadHTML (),
<code>$html = mb_convert_encoding($html, "HTML-ENTITIES", "UTF-8"); </code>
Eu recebo,
<code>你的乱发 </code>
Mesmo que os códigos encobertos sejam exibidos como caracteres chineses,你的乱发
ainda não são你的乱发
o que eu sou depois ....