¿Puede Bison analizar los personajes UTF-8?
Estoy tratando de hacer un analizador Bison para manejar los caracteres UTF-8. No quiero que el analizador interprete realmente los valores de caracteres Unicode, pero quiero que analice la cadena UTF-8 como una secuencia de bytes.
n este momento, Bison genera el siguiente código que es problemático:
if (yychar <= YYEOF)
{
yychar = yytoken = YYEOF;
YYDPRINTF ((stderr, "Now at end of input.\n"));
}
l problema es que muchos bytes de la cadena UTF-8 tendrán un valor negativo, y Bison interpreta los valores negativos como un EOF y se detiene.
¿Hay alguna forma de evitar esto