Resultados de la búsqueda a petición "beautifulsoup"

8 la respuesta

¿Cómo puedo obtener enlaces href de HTML usando Python?

import urllib2 website = "WEBSITE" openwebsite = urllib2.urlopen(website) html = getwebsite.read() print htmlHasta aquí todo bien. Pero solo quiero enlaces href del HTML de texto plano. ¿Como puedó resolver esté problema?

2 la respuesta

AttributeError al extraer datos de una URL en Python

Estoy usando el siguiente código para intentar extraer los datos en la tabla en esteURL [http://www.federalreserve.gov/econresdata/researchdata/feds200628_1.html]. Sin embargo, recibo el siguiente mensaje de error: Error: `AttributeError: ...

2 la respuesta

¿Cómo obtener el contenido entre una etiqueta y termina en HTML usando la hermosa sopa de Python?

Tengo una línea HTML de la siguiente manera: <span class="cd__headline-text">Is this model too thin for Yves Saint Laurent? </span>Me gustaría extraer el título, es decir, "¿Es este modelo demasiado delgado para Yves Saint Laurent?" de esta ...

1 la respuesta

Analiza el código html de una página web completa desplazada hacia abajo

from bs4 import BeautifulSoup import urllib,sys reload(sys) sys.setdefaultencoding("utf-8") r = urllib.urlopen('https://twitter.com/ndtv').read() soup = BeautifulSoup(r)Esto me daría no toda la página web desplazada hacia el final que quiero, ...

2 la respuesta

Extraiga enlaces para cierta sección solo de blogspot usando BeautifulSoup

Estoy tratando de extraer enlaces para cierta sección solo de Blogspot. Pero el resultado muestra que los códigos extraen todo el enlace dentro de la página. Aquí están los códigos: import urlparse import urllib from bs4 import BeautifulSoup ...

2 la respuesta

escribir y guardar archivos CSV de datos de raspado usando python y Beautifulsoup4

Estoy tratando de obtener datos del sitio web de PGA.com para obtener una tabla de todos los campos de golf en los Estados Unidos. En mi tabla CSV quiero incluir el nombre del campo de golf, dirección, propiedad, sitio web, número de teléfono. ...

3 la respuesta

¿Cómo puedo hacer un bucle de datos de raspado para varias páginas en un sitio web usando python y beautifulsoup4?

Estoy tratando de obtener datos del sitio web de PGA.com para obtener una tabla de todos los campos de golf en los Estados Unidos. En mi tabla CSV quiero incluir el nombre del campo de golf, dirección, propiedad, sitio web, número de teléfono. ...

1 la respuesta

¿Cómo encontrar todos los elementos con un atributo html personalizado con Beautiful Soup?

Tengo dos casos en los que quiero raspar html con atributos html personalizados. Este es el ejemplo de html. Cómo raspar todos los elementos con el atributo personalizado "límite". <div class="names" limit="10">Bar</div> <div id="30" ...

1 la respuesta

BeautifulSoup cómo extraer texto después de la etiqueta <br>

No sé cómo llegar al siguiente párrafo usando BeautifulSoup y cómo extraer el texto particular que quiero. Como soy nuevo en Python y BS4. Mi HTML está siguiendo: <div class="inner-content"> <div class="bred"></div> <div ...

3 la respuesta

BeautifulSoup: busca por texto dentro de una etiqueta

Observe el siguiente problema: import re from bs4 import BeautifulSoup as BS soup = BS(""" <a href="/customer-menu/1/accounts/1/update"> Edit </a> """) # This returns the <a> element soup.find( 'a', ...