Resultados de la búsqueda a petición "beautifulsoup"
¿Cómo cambiar el nombre de la etiqueta con BeautifulSoup?
Estoy usando python + BeautifulSoup para analizar un documento HTML. Ahora necesito reemplazar todo<h2 class="someclass"> elementos en un documento HTML, con<h1 class="someclass">. ¿Cómo puedo cambiar el nombre de la etiqueta, sin cambiar ...
Python usando Beautiful Soup para el procesamiento de HTML en contenido específico
Así que cuando decidí analizar el contenido de un sitio web. Por ejemplo,http: //allrecipes.com/Recipe/Slow-Cooker-Pork-Chops-II/Detail.asp [http://allrecipes.com/Recipe/Slow-Cooker-Pork-Chops-II/Detail.aspx] Quiero analizar los ingredientes en ...
Evitar que BeautifulSoup convierta mis etiquetas XML a minúsculas
Estoy usando BeautifulStoneSoup para analizar un documento XML y cambiar algunos atributos. Noté que convierte automáticamente todas las etiquetas XML a minúsculas. Por ejemplo, mi archivo fuente tiene<DocData> elementos, que BeautifulSoup ...
¿Cómo puedo encontrar una tabla después de una cadena de texto usando BeautifulSoup en Python?
Estoy tratando de extraer datos de varias páginas web que no son uniformes en la forma en que muestran sus tablas. Necesito escribir un código que busque una cadena de texto y luego ir a la tabla que sigue inmediatamente a esa cadena de texto ...
BeautifulSoup recibiendo href [duplicado]
Esta pregunta ya tiene una respuesta aquí: recuperar enlaces de la página web usando python y BeautifulSoup [/questions/1080411/retrieve-links-from-web-page-using-python-and-beautifulsoup] 14 respuestas Tengo la siguiente sopa: <a ...
Beautifulsoup y el problema de la tabla AJAX
Estoy creando un script que borra los juegos de la base de datos Team Liquid de los juegos internacionales de StarCraft 2. (http://www.teamliquid.net/tlpd/sc2-international/games Sin embargo, vengo por un problema. Tengo mi script recorriendo ...
Beautifulsoup = extraer contenido dentro de una etiqueta
Me gustaría extraer el contenido "Hola mundo". Tenga en cuenta que hay múltiples<table> y similar<td colspan="2"> en la página también. intenté lo siguiente: hello = soup.find(text='Name: ') hello.findPreviousSiblingsPero no devolvió nada. ...
Decoding entidades HTML con Python
El siguiente código de Python usa BeautifulStoneSoup para obtener la información de la API LibraryThing para "The Children of Húrin" de Tolkien. import urllib2 from BeautifulSoup import BeautifulStoneSoup URL ...
Parsing HTML con Python 2.7: HTMLParser, SGMLParser o Beautiful Soup?
Quiero hacer algunos raspados de pantalla con Python 2.7, y no tengo contexto para las diferencias entreHTMLParser, SGMLParser o Beautiful Soup. ¿Están todos tratando de resolver el mismo problema, o existen por diferentes razones? ¿Cuál es ...
Complex Beautiful Soup query
Aquí hay un fragmento de un archivo HTML que estoy explorando con Beautiful Soup. <td width="50%"> <strong class="sans"><a href="http:/website">Site</a></strong> <br /> Me gustaría obtener el<a href> para cualquier línea que tenga ...