Límite de palabra de expresiones regulares para cadenas de varios bytes
Estoy usando la biblioteca de expresiones regulares posix c (regcomp / regexec) en mi aplicación de búsqueda. Mi aplicación admite diferentes idiomas, incluidos los que usan caracteres de varios bytes. Me encuentro con un problema al usar metacaracteres de límite de palabra (\ b). Para cadenas de un solo byte, funciona bien, por ejemplo:
"\ bpaper \ b" coincide con "papel"
in embargo, si las cadenas de expresiones regulares y de consulta son de varios bytes, no parece funcionar correctamente, por ejemplo:
"\ b 紙張 \ b" no coincide con "紙張"
¿Me estoy perdiendo de algo? Cualquier ayuda sería muy apreciada
Información solicitada:
Lenguaje de programación: CRegex Library: GNU C (regex.h)Gracias