Resultados de la búsqueda a petición "beautifulsoup"

3 la respuesta

¿Cómo cambiar el nombre de la etiqueta con BeautifulSoup?

Estoy usando python + BeautifulSoup para analizar un documento HTML. Ahora necesito reemplazar todo<h2 class="someclass"> elementos en un documento HTML, con<h1 class="someclass">. ¿Cómo puedo cambiar el nombre de la etiqueta, sin cambiar ...

2 la respuesta

Python usando Beautiful Soup para el procesamiento de HTML en contenido específico

Así que cuando decidí analizar el contenido de un sitio web. Por ejemplo,http: //allrecipes.com/Recipe/Slow-Cooker-Pork-Chops-II/Detail.asp [http://allrecipes.com/Recipe/Slow-Cooker-Pork-Chops-II/Detail.aspx] Quiero analizar los ingredientes en ...

1 la respuesta

Evitar que BeautifulSoup convierta mis etiquetas XML a minúsculas

Estoy usando BeautifulStoneSoup para analizar un documento XML y cambiar algunos atributos. Noté que convierte automáticamente todas las etiquetas XML a minúsculas. Por ejemplo, mi archivo fuente tiene<DocData> elementos, que BeautifulSoup ...

1 la respuesta

¿Cómo puedo encontrar una tabla después de una cadena de texto usando BeautifulSoup en Python?

Estoy tratando de extraer datos de varias páginas web que no son uniformes en la forma en que muestran sus tablas. Necesito escribir un código que busque una cadena de texto y luego ir a la tabla que sigue inmediatamente a esa cadena de texto ...

1 la respuesta

BeautifulSoup recibiendo href [duplicado]

Esta pregunta ya tiene una respuesta aquí: recuperar enlaces de la página web usando python y BeautifulSoup [/questions/1080411/retrieve-links-from-web-page-using-python-and-beautifulsoup] 14 respuestas Tengo la siguiente sopa: <a ...

4 la respuesta

Beautifulsoup y el problema de la tabla AJAX

Estoy creando un script que borra los juegos de la base de datos Team Liquid de los juegos internacionales de StarCraft 2. (http://www.teamliquid.net/tlpd/sc2-international/games Sin embargo, vengo por un problema. Tengo mi script recorriendo ...

2 la respuesta

Beautifulsoup = extraer contenido dentro de una etiqueta

Me gustaría extraer el contenido "Hola mundo". Tenga en cuenta que hay múltiples<table> y similar<td colspan="2"> en la página también. intenté lo siguiente: hello = soup.find(text='Name: ') hello.findPreviousSiblingsPero no devolvió nada. ...

2 la respuesta

Decoding entidades HTML con Python

El siguiente código de Python usa BeautifulStoneSoup para obtener la información de la API LibraryThing para "The Children of Húrin" de Tolkien. import urllib2 from BeautifulSoup import BeautifulStoneSoup URL ...

4 la respuesta

Parsing HTML con Python 2.7: HTMLParser, SGMLParser o Beautiful Soup?

Quiero hacer algunos raspados de pantalla con Python 2.7, y no tengo contexto para las diferencias entreHTMLParser, SGMLParser o Beautiful Soup. ¿Están todos tratando de resolver el mismo problema, o existen por diferentes razones? ¿Cuál es ...

2 la respuesta

Complex Beautiful Soup query

Aquí hay un fragmento de un archivo HTML que estoy explorando con Beautiful Soup. <td width="50%"> <strong class="sans"><a href="http:/website">Site</a></strong> <br /> Me gustaría obtener el<a href> para cualquier línea que tenga ...