Resultados de la búsqueda a petición "beautifulsoup"

1 la respuesta

Tabla HTML de análisis de Python generada por JavaScript

Estoy tratando de raspar una mesa del sitio web de NYSE ( http://www1.nyse.com/about/listed/IPO_Index.html [http://www1.nyse.com/about/listed/IPO_Index.html]) en un marco de datos de pandas. Para hacerlo, tengo una configuración como esta: def ...

1 la respuesta

Obteniendo 200 respuestas pero sin iniciar sesión usando la biblioteca de solicitudes de Python

He intentado raspar la lista de seguidores de la cuenta de Twitter. Para eso, se requiere autenticación. Entonces utilicé la biblioteca de solicitudes para fines de autenticación. El problema que obtengo es que cuando trato de autenticar, obtengo ...

1 la respuesta

Cómo obtener HTML de un hermoso objeto de sopa

Tengo la siguiente lista de objetos bs4: >>> listing <div class="listingHeader"> <h2> .... >>> type(listing) <class 'bs4.element.Tag'>Quiero extraer el html sin procesar como una cadena. He intentado: >>> a = listing.contents >>> type(a) <type ...

2 la respuesta

BeautifulSoup extrae la ruta XPATH o CSS del nodo

Quiero extraer algunos datos de HTML y luego poder resaltar los elementos extraídos en el lado del cliente sin modificar el código fuente html. Y XPath o CSS Path se ven muy bien para esto.¿Es posible extraer XPATH o CSS Path directamente desde ...

1 la respuesta

BeautifulSoup se comporta de manera diferente en la máquina Amazon EC2

Estoy ejecutando el siguiente script: from bs4 import BeautifulSoup import urllib2 import sys print sys.version url = 'https://www.google.com/finance' page = urllib2.urlopen(url).read() soup = BeautifulSoup(page) trends_tag = soup.find('div', ...

1 la respuesta

Uso de solicitudes y BeautifulSoup: Python devuelve una etiqueta sin texto

Estoy tratando de capturar el número de visitas en esta página, pero Python devuelve la etiqueta sin texto. Esto es lo que he hecho. import requests from bs4 import BeautifulSoup r ...

1 la respuesta

Extraer contenido de <Script con BeautifulSoup

1 / Estoy tratando de extraer una parte del guión usando una sopa hermosa pero no imprime Nothing. Que pasa URL = "http://www.reuters.com/video/2014/08/30/woman-who-drank-restaurants-tainted-tea?videoId=341712453" oururl= ...

4 la respuesta

Ubuntu: ¿Cómo instalar un módulo Python (BeautifulSoup) en Python 3.3 en lugar de Python 2.7?

Tengo este código (como está escrito en BS4 documentaion): from bs4 import BeautifulSoupCuando ejecuto el script (usando python3) me sale el error: ImportError: No module named 'bs4'Así instalado BeatifulSoup por: sudo pip install ...

5 la respuesta

UnicodeEncodeError: el códec 'charmap' no puede codificar caracteres

Estoy tratando de raspar un sitio web, pero me da un error. Estoy usando el siguiente código: import urllib.request from bs4 import BeautifulSoup get = urllib.request.urlopen("https://www.website.com/") html = get.read() soup ...

2 la respuesta

BeautifulSoup, pero para CSS?

BeautifulSoup analiza HTML y ofrece varias formas de manipular y buscar dentro de HTML. ¿Hay algo similar para CSS? Específicamente, me gustaría saber si un texto HTML dado se representa como negrita. O tiene un antepasado que es el<strong> o ...