Resultados de la búsqueda a petición "beautifulsoup"
Eliminar 'u de una salida de webscrape
Hola, estoy usando Beautifulsoup para analizar un sitio web y obtener un nombre como salida. Pero después de ejecutar el script, obtengo un[u'word1', u'word2', u'word3'] salida. Lo que estoy buscando es'word1 word2 word3'. ¿Cómo deshacerse de ...
Intenté Python BeautifulSoup y Phantom JS: TODAVÍA no puede raspar sitios web
Es posible que haya visto mis frustraciones desesperadas en las últimas semanas aquí. He estado recogiendo algunos datos del tiempo de espera y todavía no puedo obtener datos de estos dos sitios http://www.centura.org/erwait ...
Etiquetas de cierre automático en BeautifulSoup
Usando BeautifulSoup para analizar mi XML import BeautifulSoup soup = BeautifulSoup.BeautifulStoneSoup( """<alan x="y" /><anne>hello</anne>""" ) # selfClosingTags=['alan']) print soup.prettify()Esto generará: <alan x="y"> <anne> hello </anne> ...
Eliminando etiquetas span de la sopa BeautifulSoup / Python
Tengo una sopa en Python como esta: <p> <span style="text-decoration: underline; color: #3366ff;"> Title: </span> Info </p> <p> <span style="color: #3366ff;"> <span style="text-decoration: underline;"> Title2: </span> </span> Info2 </p>Me ...
Web scraping un sitio web con contenido dinámico de JavaScript
Así que estoy usando python y beautifulsoup4 (al que no estoy vinculado) para raspar un sitio web. El problema es que cuando uso urlib para tomar el html de una página, no es toda la página porque parte se genera a través de JavaScript. ¿Hay ...
Pele las etiquetas HTML para obtener cadenas en Python
Intenté obtener algunas cadenas de un archivo HTML con BeautifulSoup y cada vez que trabajo con él obtengo resultados parciales. Quiero obtener las cadenas en cada elemento / etiqueta li. Hasta ahora he podido obtener todo en ul como ...
Raspado de Google Finance (BeautifulSoup)
Estoy tratando de eliminar Google Finance y obtener la tabla "Acciones relacionadas", que tiene la identificación "cc-table" y la clase "gf-table" según el inspector de la página web en Chrome. (Enlace de ...
Extraer contenido HTML de una página de búsqueda usando Beautiful Soup con Python
Estoy tratando de obtener información de algunos hoteles de booking.com usando Beautiful Soup. Necesito obtener cierta información de todos los alojamientos en España. Esta es la url de ...
Python beautifulsoup iframe documento extracto html
Estoy tratando de aprender un poco de sopa hermosa y obtener algunos datos html de algunos iFrames, pero hasta ahora no he tenido mucho éxito. Por lo tanto, analizar el iFrame en sí mismo no parece ser un problema con BS4, pero no parece obtener ...
¿Usa BeautifulSoup para analizar líneas separadas por etiquetas de texto?
Tengo una página que se ve así: Company A<br /> 123 Main St.<br /> Suite 101<br /> Someplace, NY 1234<br /> <br /> <br /> <br /> Company B<br /> 456 Main St.<br /> Someplace, NY 1234<br /> <br /> <br /> <br />A veces hay dos en lugar de tres ...