Resultados de la búsqueda a petición "beautifulsoup"

1 la respuesta

¿Forma rápida y efectiva de analizar HTML roto?

Estoy trabajando en proyectos grandes que requieren un análisis rápido de HTML, incluida la recuperación de páginas HTML rotas. Actualmente, lxml es mi elección, sé que también proporciona una interfaz para el modo de recuperación de libxml2, ...

1 la respuesta

¿Cómo mantengo los espacios en blanco en BeautifulSoup.contents

La mayoría de los ejemplos que encuentro en línea muestran cómo eliminar espacios en blanco, pero en mi caso necesito mantenerlo. Tengo html = "I can flip this whole thing with one hand\n <span>D#m</span>\nThe ringleader man\n<span>A#</span> ...

7 la respuesta

Proceso repetitivo para seguir enlaces en un sitio web (BeautifulSoup)

Estoy escribiendo un código en Python para obtener todas las etiquetas 'a' en una URL usando Beautiful soup, luego uso el enlace en la posición 3, luego debería seguir ese enlace, repetiré este proceso unas 18 veces. Incluí el código a ...

3 la respuesta

TypeError: se requiere un objeto similar a bytes, no 'str' en python y CSV

TypeError: se requiere un objeto similar a bytes, no 'str' obteniendo el error anterior mientras se ejecuta el código python debajo para guardar los datos de la tabla HTML en el archivo Csv. no sé cómo obtener rideup.pls ayúdame. import csv ...

1 la respuesta

Comprender la función Find () en Beautiful Soup

Sé que lo que intento hacer es simple, pero me está causando dolor. Me gustaría extraer datos de HTML usando BeautifulSoup. Para hacer eso necesito usar correctamente el.find() función. Aquí está el HTML con el que estoy trabajando: <div ...

2 la respuesta

Deshabilitar el manejo especial de atributos de "clase"

La historia: Cuando analizas HTML conBeautifulSoup, class el atributo se considera unatributo de valores múltiples [http://www.crummy.com/software/BeautifulSoup/bs4/doc/#searching-by-css-class]y se maneja de manera especial: Recuerde que una ...

1 la respuesta

<error de urlopen [Errno 1] _ssl.c: 510: error: 14077417: SSL

¿Alguien sabe por qué recibo este error? SSLError: [Errno 1] _ssl.c:510: error:14077438:SSL routines:SSL23_GET_SERVER_HELLO:tlsv1Me sale el error cuando uso las solicitudes o urllib2, estoy ejecutando el código en Kodi. El código funciona bien ...

4 la respuesta

Descargue archivos .xls de una página web usando Python y BeautifulSoup

Quiero descargar todo el.xls o.xlsx o.csv desde este sitio web a una carpeta específica. https://www.rbi.org.in/Scripts/bs_viewcontent.aspx?Id=2009He buscado mecanizar, sopa hermosa, urllib2, etc. Mecanizar no funciona en Python 3, urllib2 ...

1 la respuesta

BeautifulSoup4 stripped_strings me da objetos de bytes?

Estoy tratando de sacar el texto de una cita en bloque que se ve así: <blockquote class="postcontent restore "> 01 Oyasumi <br></br> 02 DanSin' <br></br> 03 w.t.s. <br></br> 04 Lovism <br></br> 05 NoName <br></br> 06 Gakkou <br></br> 07 ...

2 la respuesta

Hermosa sopa si la clase "contiene" o expresión regular?

Si los nombres de mis clases son constantemente diferentes, por ejemplo: listing-col-line-3-11 dpt 41 listing-col-block-1-22 dpt 41 listing-col-line-4-13 CWK 12Normalmente podría hacer: for EachPart in soup.find_all("div", {"class" : ...