DOMDocument Codierungsprobleme / transformierte Zeichen

Ich verwende DOMDocument zum Bearbeiten / Ändern von HTML, bevor es auf der Seite ausgegeben wird. Dies ist nur ein HTML-Fragment, keine vollständige Seite. Mein anfängliches Problem war, dass alle französischen Zeichen durcheinander kamen, was ich nach einigem Ausprobieren korrigieren konnte. Jetzt scheint es nur noch ein Problem zu geben: 'Charakter verwandelt sich in? .

Der Code

<?php
    $dom = new DOMDocument('1.0','utf-8');
         $dom->loadHTML(utf8_decode($row->text));

         //Some pretty basic modification here, not even related to text

         //reinsert HTML, and make sure to remove DOCTYPE, html and body that get added auto.
         $row->text = utf8_encode(preg_replace('/^<!DOCTYPE.+?>/', '', str_replace( array('<html>', '</html>', '<body>', '</body>'), array('', '', '', ''), $dom->saveHTML())));
?>

Ich weiß, dass es mit dem Dekodieren / Kodieren von utf8 unordentlich wird, aber dies ist die einzige Möglichkeit, wie ich es zum Laufen bringen kann. Hier ist eine Beispielzeichenfolge:

Input: Sans doute parce qu'il vient d'atteindre une date déterminante dans son spectaculaire cheminement

Output: Sans doute parce qu? Il vient d? Atteindre une date déterminante dans son spectaculaire cheminement

Wenn ich weitere Details finde, füge ich diese hinzu. Vielen Dank für Ihre Zeit und Unterstützung!

Antworten auf die Frage(8)

Ihre Antwort auf die Frage