Resultados de la búsqueda a petición "beautifulsoup"

1 la respuesta

Cómo extraer enlaces html con una palabra coincidente de un sitio web usando python

Tengo una url, digamoshttp://www.bbc.com/news/world/asia/. Justo en esta página quería extraer todos los enlaces que tiene India o INDIA o india (debe ser insensible a mayúsculas y minúsculas). Si hago clic en cualquiera de los enlaces de ...

1 la respuesta

Python - Solicitudes / RoboBrowser - ASPX POST JavaScript

Estoy portando un script bash que usa curl y POSTs las cargas útiles en el código a las URL y funciona. El problema básico es que, con robobrowser, tengo problemas para publicar usando los formularios de página. Recorriendo el sitio: Inicie ...

1 la respuesta

BeautifulSoup contando etiquetas sin analizarlas en su interior

Pensé en lo siguientemientras escribe una respuesta a esta pregunta [https://stackoverflow.com/questions/27673349/python-xml-parsing-algorithm-speed/27673558#27673558] . Supongamos que tengo un profundamente anidadoxml archivo como este (pero ...

1 la respuesta

Hermoso orden de aparición de etiquetas

Considere la siguiente situación: tag1 = soup.find(**data_attrs) tag2 = soup.find(**delim_attrs)¿Hay alguna forma de averiguar qué etiqueta ocurrió "primero" en la página? Aclaraciones: Para mis propósitos, el orden es el mismo que el método ...

4 la respuesta

ID coincidentes en BeautifulSoup

Estoy usando BeautifulSoup - módulo de Python. Tengo que encontrar alguna referencia a los div con id como: 'post- #'. Por ejemplo: <div id="post-45">...</div> <div id="post-334">...</div>¿Cómo puedo filtrar esto? html = '<div ...

2 la respuesta

Profundidad del primer recorrido en BeautifulSoup Parse Tree

¿Hay alguna manera de hacer un DFT en un árbol de análisis BeautifulSoup? Estoy tratando de hacer algo como comenzar en la raíz, por lo general, obtener todos los elementos secundarios y luego para cada elemento secundario obtener sus elementos ...

2 la respuesta

beautifulsoup find_all bug?

Hoy en día estoy usando una hermosa sopa para analizar la página html. Pero a veces el resultado que obtuve con find_all es menor que el número en las páginas. Por ejemplo, esta ...

2 la respuesta

Python - beautifulsoup, aplique en cada archivo de texto en la carpeta y produzca un nuevo archivo de texto

Estoy usando el siguiente código Python - Beautifulsoup para eliminar elementos html de un archivo de texto: from bs4 import BeautifulSoup with open("textFileWithHtml.txt") as markup: soup = BeautifulSoup(markup.read()) with ...

3 la respuesta

Importando bs4 en Python 3.5

He instalado Python 3.5 y Beautifulsoup4. Cuando intento importar bs4, aparece el siguiente error. ¿Hay alguna solución para eso? ¿O debería instalar Python 3.4 en su lugar? Sea muy explícito: soy nuevo en programación. ¡Muchas ...

2 la respuesta

raspar una respuesta de una opción seleccionada en la lista desplegable

Este es un ejemplo de una página que enumera las estadísticas de béisbol de un jugador seleccionado, por defecto al año más reciente (2014, que pronto ...