Resultados de la búsqueda a petición "unicode"

9 la respuesta

Cuál es la mejor manera de eliminar acentos en una cadena Unicode de Python?

Tengo una cadena Unicode en Python y me gustaría eliminar todos los acentos (signos diacríticos). Encontré en la Web una forma elegante de hacer esto en Java: convierta la cadena Unicode a su forma normalizada larga (con un carácter separado ...

4 la respuesta

¿Cómo leo UTF-8 con el operador de diamante (<>)?

Quiero leer la entrada UTF-8 en Perl, sin importar si proviene de la entrada estándar o de un archivo, utilizando el operador de diamante:while(<>){...}. Por lo tanto, mi script debe poder llamarse de estas dos formas, como de costumbre, dando ...

1 la respuesta

¿Por qué Delphi IBX TWideMemoField convierte el orden de bytes en la cadena UTF8 y cómo evitarlo?

Estoy usando Delphi 2009 con IBX en la base de datos Firebird 3 (no tengo opción de elegir otras tecnologías, tengo que adaptarme a la situación). Tengo las siguientes definiciones: l campo @Firebird BLOB se define como: BLOB SUB_TYPE 0 SEGMENT ...

4 la respuesta

Cuál es la expresión regular adecuada para que coincida con todas las formas de letras minúsculas utf-8 / unicode

Me gustaría coincidir contodo formas de letras minúsculas en el bloque latino. El trivial '[a-z]' solo coincide con los caracteres entre U + 0061 y U + 007A, y no con todas las otras formas en minúsculas. Me gustaría hacer coincidir todas las ...

1 la respuesta

¿Por qué Unicode está restringido a 0x10FFFF?

¿Por qué el punto de código Unicode máximo está restringido a 0x10FFFF? ¿Es posible representar Unicode por encima de este punto de código, por ejemplo 0x10FFFF + 0x000001 = 0x110000 - a través de cualquier esquema de codificación como UTF-16, ...

4 la respuesta

python UnicodeEncodeError> ¿Cómo puedo simplemente eliminar los problemáticos caracteres Unicode?

Aquí está lo que hice .. >>> soup = BeautifulSoup (html) >>> soup Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode character u'\xae' in position 96953: ordinal not in ...

1 la respuesta

Convertir escape Unicode a texto hebreo

Tengo el siguiente texto en un archivo json: "\u00d7\u0090\u00d7\u0097\u00d7\u0095\u00d7\u0096\u00d7\u00aa \u00d7\u00a4\u00d7\u0095\u00d7\u009c\u00d7\u0092"que representa el texto "אחוזת פולג" en hebreo. No importa qué codificación / ...

7 la respuesta

Diferencia entre open y codecs.open en Python

Hay dos formas de abrir un archivo de texto en Python: f = open(filename) import codecs f = codecs.open(filename, encoding="utf-8")Cuando escodecs.open preferible aopen?

2 la respuesta

R write.csv con codificación UTF-16

Tengo problemas para generar un data.frame usandowrite.csv utilizando la codificación de caracteres UTF-16. Fondo: estoy tratando de escribir un archivo CSV desde un data.frame para usar en Excel. A Excel Mac 2011 parece no gustarle UTF-8 (si ...

1 la respuesta

¿Cuántos bytes tiene un carácter Unicode?

Estoy un poco confundido acerca de las codificaciones. Hasta donde yo sé, los viejos caracteres ASCII tomaban un byte por carácter. ¿Cuántos bytes requiere un carácter Unicode? Supongo que un carácter Unicode puede contener todos los ...