Problemas de codificación con XMLWriter (PHP)
Toma este simple código PHP:
$xmlWriter = new XMLWriter();
$xmlWriter->openURI('php://output');
$xmlWriter->startDocument('1.0', 'utf-8');
$xmlWriter->writeElement('test', $data);
$xmlWriter->endDocument();
$xmlWriter->flush();
La clase XMLWriter tiene una buena característica: convertirá cualquier dato que le des a la codificación de salida. Por ejemplo aquí se convertirá$data
a UTF-8 porque pasé'utf-8'
en elstartDocument
función.
El problema es que en mi caso el contenido de$data
proviene de una base de datos cuyo formato de salida es UTF-8 ypor lo tanto ya está en UTF-8. El XMLWriterProbablemente piense que los datos están en ISO-8859-1 y los convierte de nuevo a UTF-8, y obtengo símbolos extraños donde debo obtener acentos.
Actualmente estoy usandoutf8_decode
alrededor de cada cadena que proviene de la base de datos, lo que significa que estoy convirtiendo de UTF-8 a ISO-8859-1, y luego XMLWriter lo convierte de nuevo en UTF-8.
Esto funciona pero no está limpio:
$xmlWriter->writeElement('test', utf8_decode($data));
¿Hay una solución más limpia?
EDITAR: mostrando un ejemplo completo
$xmlWriter = new XMLWriter();
$xmlWriter->openURI('php://output');
$xmlWriter->startDocument('1.0', 'utf-8');
$xmlWriter->startElement('usersList');
$database = new PDO('mysql:host=localhost;dbname=xxxxx', 'xxxxx', 'xxxxx');
$database->exec('SET CHARACTER SET UTF8');
$database->exec('SET NAMES UTF8');
foreach ($database->query('SELECT name FROM usersList') as $user)
$xmlWriter->writeElement('user', $user[0]); // if the user's name is 'hervé' in the database, it will print 'hervé' instead
$xmlWriter->endElement();
$xmlWriter->endDocument();
$xmlWriter->flush();