Resultados da pesquisa a pedido "beautifulsoup"
Beautifulsoup = extrair conteúdo dentro de uma tag
Eu gostaria de extrair o conteúdo "Olá, mundo". Por favor, note que existem múltiplos<table> e similar<td colspan="2"> na página també i tentei o seguinte: hello = soup.find(text='Name: ') hello.findPreviousSiblingsMas não retornou nada. ...
ecodificação de entidades HTML com Python
O código Python a seguir usa o BeautifulStoneSoup para buscar as informações da API do LibraryThing para "The Children of Húrin" de Tolkie import urllib2 from BeautifulSoup import BeautifulStoneSoup URL ...
Parsing HTML com Python 2.7 - HTMLParser, SGMLParser ou Beautiful Soup?
Eu quero fazer algumas capturas de tela com o Python 2.7 e não tenho contexto para as diferenças entreHTMLParser, SGMLParser, ou sopa bonita. Estão todos tentando resolver o mesmo problema ou existem por diferentes razões? Qual é a mais ...
Consulta de sopa bonita e complexa
qui está um trecho de um arquivo HTML que estou explorando com a Beautiful Sou <td width="50%"> <strong class="sans"><a href="http:/website">Site</a></strong> <br /> Gostaria de obter o<a href> para qualquer linha que tenha ...
Alterar o valor do elemento com BeautifulSoup retorna o elemento vazio
from BeautifulSoup import BeautifulStoneSoup xml_data = """ <doc> <test>test</test> <foo:bar>Hello world!</foo:bar> </doc> """ soup = BeautifulStoneSoup(xml_data) print soup.prettify() make = soup.find('foo:bar') print make # prints ...
roblemas de codificação @ Python e BeautifulSoup
Estou escrevendo um rastreador com Python usando BeautifulSoup, e tudo correu muito bem até que eu entrei neste site: http: //www.elnorte.ec [http://www.elnorte.ec/] Estou obtendo o conteúdo com a biblioteca de solicitações: r = ...
remover determinados atributos das tags HTML
Como posso remover certos atributos, como identificação, estilo, classe etc. do código HTM Eu pensei que poderia usar o lxml.html.clean module [http://lxml.de/lxmlhtml.html#cleaning-up-html], mas, como se vê, só posso remover atributos de estilo ...
Parar XML não padrão (tag CDATA)
Quando eu quero analisar documentos XML em Python usando a biblioteca BeautifulSoup, enfrentei alguns problemas. O documento XML que eu quero analisar: <item> <title><![CDATA[Title Sample]]></title> ...
Batch baixando texto e imagens de URL com Python / urllib / beautifulsoup?
Estive navegando em várias postagens aqui, mas simplesmente não consigo entender imagens e texto em lote de um determinado URL com o Pytho import urllib,urllib2 import urlparse from BeautifulSoup import BeautifulSoup import os, sys def ...
RL @Clean com BeautifulSoup
My script import BeautifulSoup as bs from BeautifulSoup import BeautifulSoup url_list = sys.argv[1] urls = [tag['href'] for tag in BeautifulSoup(open(url_list)).findAll('a')] ...