urllib2 lee a unicode

Question

Jun 20, 2009, 05:46 AM

urllib2 lee a unicode

Necesito almacenar el contenido de un sitio que puede estar en cualquier idioma. Y necesito poder buscar en el contenido una cadena Unicode.

He intentado algo como:

<code>import urllib2

req = urllib2.urlopen('http://lenta.ru')
content = req.read()
</code>

El contenido es un flujo de bytes, por lo que puedo buscar una cadena Unicode.

Necesito de alguna manera que cuando lo haga.urlopen y luego lea para usar el conjunto de caracteres de los encabezados para decodificar el contenido y codificarlo en UTF-8.

Respuestas a la pregunta(2)

Preguntas populares

0 la respuesta

chrome.runtime.sendMessage lanza una excepción del script de contenido después de volver a cargar la extensión de Chrome

0 la respuesta

Magento añadir wishlist_link a bloque diferente?

0 la respuesta

Navegando a una nueva pantalla cuando el valor de la transmisión en BLOC cambia

0 la respuesta

¿Cómo verificar si una solicitud proviene del mismo servidor o de un servidor diferente?

0 la respuesta

Validación en Editar Texto

¡Eres muy activo! ¡Es genial!

urllib2 lee a unicode

Respuestas a la pregunta(2)

Su respuesta a la pregunta

Preguntas populares