Проблемы с кодировкой DOMDocument / преобразование символов
Я использую DOMDocument для манипулирования / изменения HTML, прежде чем он получит вывод на страницу. Это только фрагмент HTML, а не полная страница. Моя первоначальная проблема заключалась в том, что все французские персонажи испортились, что я смог исправить после некоторых проб и ошибок. Теперь кажется, что остается только одна проблема: «персонаж превращается в? ,
Код :
<?php
$dom = new DOMDocument('1.0','utf-8');
$dom->loadHTML(utf8_decode($row->text));
//Some pretty basic modification here, not even related to text
//reinsert HTML, and make sure to remove DOCTYPE, html and body that get added auto.
$row->text = utf8_encode(preg_replace('/^<!DOCTYPE.+?>/', '', str_replace( array('<html>', '</html>', '<body>', '</body>'), array('', '', '', ''), $dom->saveHTML())));
?>
Я знаю, что с декодированием / кодированием utf8 все становится беспорядочно, но это единственный способ, которым я мог до сих пор работать. Вот пример строки:
Входные данные: без даты, до даты и до даты, до и после спектакля
Результат: Sans Doute Parce Quél Vient D? Atindind None Date Déterminante Dans Son Spectulaire Cheminement
Если я найду больше деталей, я добавлю их. Спасибо за ваше время и поддержку!