Resultados da pesquisa a pedido "beautifulsoup"

2 a resposta

Beautifulsoup = extrair conteúdo dentro de uma tag

Eu gostaria de extrair o conteúdo "Olá, mundo". Por favor, note que existem múltiplos<table> e similar<td colspan="2"> na página també i tentei o seguinte: hello = soup.find(text='Name: ') hello.findPreviousSiblingsMas não retornou nada. ...

2 a resposta

ecodificação de entidades HTML com Python

O código Python a seguir usa o BeautifulStoneSoup para buscar as informações da API do LibraryThing para "The Children of Húrin" de Tolkie import urllib2 from BeautifulSoup import BeautifulStoneSoup URL ...

4 a resposta

Parsing HTML com Python 2.7 - HTMLParser, SGMLParser ou Beautiful Soup?

Eu quero fazer algumas capturas de tela com o Python 2.7 e não tenho contexto para as diferenças entreHTMLParser, SGMLParser, ou sopa bonita. Estão todos tentando resolver o mesmo problema ou existem por diferentes razões? Qual é a mais ...

2 a resposta

Consulta de sopa bonita e complexa

qui está um trecho de um arquivo HTML que estou explorando com a Beautiful Sou <td width="50%"> <strong class="sans"><a href="http:/website">Site</a></strong> <br /> Gostaria de obter o<a href> para qualquer linha que tenha ...

2 a resposta

Alterar o valor do elemento com BeautifulSoup retorna o elemento vazio

from BeautifulSoup import BeautifulStoneSoup xml_data = """ <doc> <test>test</test> <foo:bar>Hello world!</foo:bar> </doc> """ soup = BeautifulStoneSoup(xml_data) print soup.prettify() make = soup.find('foo:bar') print make # prints ...

5 a resposta

roblemas de codificação @ Python e BeautifulSoup

Estou escrevendo um rastreador com Python usando BeautifulSoup, e tudo correu muito bem até que eu entrei neste site: http: //www.elnorte.ec [http://www.elnorte.ec/] Estou obtendo o conteúdo com a biblioteca de solicitações: r = ...

1 a resposta

remover determinados atributos das tags HTML

Como posso remover certos atributos, como identificação, estilo, classe etc. do código HTM Eu pensei que poderia usar o lxml.html.clean module [http://lxml.de/lxmlhtml.html#cleaning-up-html], mas, como se vê, só posso remover atributos de estilo ...

2 a resposta

Parar XML não padrão (tag CDATA)

Quando eu quero analisar documentos XML em Python usando a biblioteca BeautifulSoup, enfrentei alguns problemas. O documento XML que eu quero analisar: <item> <title><![CDATA[Title Sample]]></title> ...

1 a resposta

Batch baixando texto e imagens de URL com Python / urllib / beautifulsoup?

Estive navegando em várias postagens aqui, mas simplesmente não consigo entender imagens e texto em lote de um determinado URL com o Pytho import urllib,urllib2 import urlparse from BeautifulSoup import BeautifulSoup import os, sys def ...

2 a resposta

RL @Clean com BeautifulSoup

My script import BeautifulSoup as bs from BeautifulSoup import BeautifulSoup url_list = sys.argv[1] urls = [tag['href'] for tag in BeautifulSoup(open(url_list)).findAll('a')] ...