Resultados de la búsqueda a petición "beautifulsoup"
Cómo extraer enlaces html con una palabra coincidente de un sitio web usando python
Tengo una url, digamoshttp://www.bbc.com/news/world/asia/. Justo en esta página quería extraer todos los enlaces que tiene India o INDIA o india (debe ser insensible a mayúsculas y minúsculas). Si hago clic en cualquiera de los enlaces de ...
Python - Solicitudes / RoboBrowser - ASPX POST JavaScript
Estoy portando un script bash que usa curl y POSTs las cargas útiles en el código a las URL y funciona. El problema básico es que, con robobrowser, tengo problemas para publicar usando los formularios de página. Recorriendo el sitio: Inicie ...
BeautifulSoup contando etiquetas sin analizarlas en su interior
Pensé en lo siguientemientras escribe una respuesta a esta pregunta [https://stackoverflow.com/questions/27673349/python-xml-parsing-algorithm-speed/27673558#27673558] . Supongamos que tengo un profundamente anidadoxml archivo como este (pero ...
Hermoso orden de aparición de etiquetas
Considere la siguiente situación: tag1 = soup.find(**data_attrs) tag2 = soup.find(**delim_attrs)¿Hay alguna forma de averiguar qué etiqueta ocurrió "primero" en la página? Aclaraciones: Para mis propósitos, el orden es el mismo que el método ...
ID coincidentes en BeautifulSoup
Estoy usando BeautifulSoup - módulo de Python. Tengo que encontrar alguna referencia a los div con id como: 'post- #'. Por ejemplo: <div id="post-45">...</div> <div id="post-334">...</div>¿Cómo puedo filtrar esto? html = '<div ...
Profundidad del primer recorrido en BeautifulSoup Parse Tree
¿Hay alguna manera de hacer un DFT en un árbol de análisis BeautifulSoup? Estoy tratando de hacer algo como comenzar en la raíz, por lo general, obtener todos los elementos secundarios y luego para cada elemento secundario obtener sus elementos ...
beautifulsoup find_all bug?
Hoy en día estoy usando una hermosa sopa para analizar la página html. Pero a veces el resultado que obtuve con find_all es menor que el número en las páginas. Por ejemplo, esta ...
Python - beautifulsoup, aplique en cada archivo de texto en la carpeta y produzca un nuevo archivo de texto
Estoy usando el siguiente código Python - Beautifulsoup para eliminar elementos html de un archivo de texto: from bs4 import BeautifulSoup with open("textFileWithHtml.txt") as markup: soup = BeautifulSoup(markup.read()) with ...
Importando bs4 en Python 3.5
He instalado Python 3.5 y Beautifulsoup4. Cuando intento importar bs4, aparece el siguiente error. ¿Hay alguna solución para eso? ¿O debería instalar Python 3.4 en su lugar? Sea muy explícito: soy nuevo en programación. ¡Muchas ...
raspar una respuesta de una opción seleccionada en la lista desplegable
Este es un ejemplo de una página que enumera las estadísticas de béisbol de un jugador seleccionado, por defecto al año más reciente (2014, que pronto ...