Resultados de la búsqueda a petición "beautifulsoup"

3 la respuesta

Eliminar 'u de una salida de webscrape

Hola, estoy usando Beautifulsoup para analizar un sitio web y obtener un nombre como salida. Pero después de ejecutar el script, obtengo un[u'word1', u'word2', u'word3'] salida. Lo que estoy buscando es'word1 word2 word3'. ¿Cómo deshacerse de ...

1 la respuesta

Intenté Python BeautifulSoup y Phantom JS: TODAVÍA no puede raspar sitios web

Es posible que haya visto mis frustraciones desesperadas en las últimas semanas aquí. He estado recogiendo algunos datos del tiempo de espera y todavía no puedo obtener datos de estos dos sitios http://www.centura.org/erwait ...

2 la respuesta

Etiquetas de cierre automático en BeautifulSoup

Usando BeautifulSoup para analizar mi XML import BeautifulSoup soup = BeautifulSoup.BeautifulStoneSoup( """<alan x="y" /><anne>hello</anne>""" ) # selfClosingTags=['alan']) print soup.prettify()Esto generará: <alan x="y"> <anne> hello </anne> ...

2 la respuesta

Eliminando etiquetas span de la sopa BeautifulSoup / Python

Tengo una sopa en Python como esta: <p> <span style="text-decoration: underline; color: #3366ff;"> Title: </span> Info </p> <p> <span style="color: #3366ff;"> <span style="text-decoration: underline;"> Title2: </span> </span> Info2 </p>Me ...

1 la respuesta

Web scraping un sitio web con contenido dinámico de JavaScript

Así que estoy usando python y beautifulsoup4 (al que no estoy vinculado) para raspar un sitio web. El problema es que cuando uso urlib para tomar el html de una página, no es toda la página porque parte se genera a través de JavaScript. ¿Hay ...

3 la respuesta

Pele las etiquetas HTML para obtener cadenas en Python

Intenté obtener algunas cadenas de un archivo HTML con BeautifulSoup y cada vez que trabajo con él obtengo resultados parciales. Quiero obtener las cadenas en cada elemento / etiqueta li. Hasta ahora he podido obtener todo en ul como ...

2 la respuesta

Raspado de Google Finance (BeautifulSoup)

Estoy tratando de eliminar Google Finance y obtener la tabla "Acciones relacionadas", que tiene la identificación "cc-table" y la clase "gf-table" según el inspector de la página web en Chrome. (Enlace de ...

1 la respuesta

Extraer contenido HTML de una página de búsqueda usando Beautiful Soup con Python

Estoy tratando de obtener información de algunos hoteles de booking.com usando Beautiful Soup. Necesito obtener cierta información de todos los alojamientos en España. Esta es la url de ...

1 la respuesta

Python beautifulsoup iframe documento extracto html

Estoy tratando de aprender un poco de sopa hermosa y obtener algunos datos html de algunos iFrames, pero hasta ahora no he tenido mucho éxito. Por lo tanto, analizar el iFrame en sí mismo no parece ser un problema con BS4, pero no parece obtener ...

5 la respuesta

¿Usa BeautifulSoup para analizar líneas separadas por etiquetas de texto?

Tengo una página que se ve así: Company A<br /> 123 Main St.<br /> Suite 101<br /> Someplace, NY 1234<br /> <br /> <br /> <br /> Company B<br /> 456 Main St.<br /> Someplace, NY 1234<br /> <br /> <br /> <br />A veces hay dos en lugar de tres ...