Resultados de la búsqueda a petición "beautifulsoup"

2 la respuesta

Python BeautifulSoup que devuelve la lista vacía

Estoy tratando de crear un script de Python para extraer los precios de los precios de la Tarjeta Yugioh desde tcgplayer.com usando BeautifulSoup. Cuando busca una tarjeta en este sitio web, devuelve una página de resultados de búsqueda con ...

3 la respuesta

BeautifulSoup: ¿modifica todos los enlaces en una pieza de HTML?

Necesito poder modificar cada enlace en un documento HTML. Sé que necesito usar elSoupStrainer pero no soy 100% positivo sobre cómo implementarlo. Si alguien pudiera dirigirme a un buen recurso o proporcionar un ejemplo de código, sería muy ...

3 la respuesta

Beautiful Soup para analizar la URL para obtener otros datos de URL

Necesito analizar una URL para obtener una lista de las URL que enlazan con una página de detalles. Luego, desde esa página, necesito obtener todos los detalles de esa página. Necesito hacerlo de esta manera porque la URL de la página de detalles ...

1 la respuesta

No se pueden obtener datos de la tabla: HTML

Estoy tratando de obtener la 'Tabla de anuncios de ganancias' de: https://www.zacks.com/stock/research/amzn/earnings-announcements [https://www.zacks.com/stock/research/amzn/earnings-announcements] Estoy usando diferentes opciones de ...

2 la respuesta

hermosa sopa, eliminando ciertos artículos con Findall ()

Tengo una serie de elementos de la lista devueltos por find_all () <li class="rsltItem" mh-property-list-item="".......El artículo tiene muchos elementos anidados. De vez en cuando, uno de los li es ligeramente diferente: <li class="rsltItem ...

1 la respuesta

Python BeautifulSoup equivalente a lxml make_links_absolute

Entonces lxml tiene una característica muy manual: make_links_absolute: doc = lxml.html.fromstring(some_html_page) doc.make_links_absolute(url_for_some_html_page)y todos los enlaces en doc son absolutos ahora. ¿Hay un equivalente fácil en ...

2 la respuesta

BeautifulSoup: ¿Cómo extraigo todos los <li> s de una lista de <ul> s que contiene algunos <ul> s anidados?

Mi código fuente se ve así: <h3>Header3 (Start here)</h3> <ul> <li>List items</li> <li>Etc...</li> </ul> <h3>Header 3</h3> <ul> <li>List items</li> <ul> <li>Nested list items</li> <li>Nested list items</li></ul> <li>List items</li> </ul> ...

1 la respuesta

Analizar una etiqueta de script con dictos en BeautifulSoup

Trabajando en una respuesta parcial aesta [https://stackoverflow.com/questions/44957324/python-issue-scraping-with-beautifulsoup/44960710#44960710] pregunta, me encontré con unbs4.element.Tag eso es un desastre de dictados y listas anidadas (sa ...

3 la respuesta

hermosa sopa solo obtén el valor dentro de la etiqueta

El siguiente comando: volume = soup.findAll("span", {"id": "volume"})[0]da: <span class="gr_text1" id="volume">16,103.3</span>cuando publico una impresión (volumen). ¿Cómo obtengo solo el número?

1 la respuesta

BeautifulSoup get_text de find_all

Este es mi primer trabajo con web scraping. Hasta ahora puedo navegar y encontrar la parte del HTML que quiero. Puedo imprimirlo también. El problema es imprimir solo el texto, que no funcionará. Recibo el siguiente error cuando ...