Resultados da pesquisa a pedido "beautifulsoup"
Beautiful Soup Find - obtenha apenas o texto
Eu tinha esse código cuspindo apenas o preço como uma string (125.01), mas devo ter mudado alguma coisa, porque agora ele imprime toda a linha com as tags html e tudo mais. Como posso imprimir apenas o texto, sem usar expressões ...
Sintaxe inválida do BeautifulSoup no Python 3.4 (após 2to3.py)
Estou tentando instalar o Beautiful Soup 4 no Python 3.4. Instalei-o na linha de comando (recebi o erro de sintaxe inválido porque não o havia convertido), executei o2to3.py script de conversão parabs4 e agora recebo um novo erro de sintaxe ...
Obter texto de tags HTML sem texto de tags filho internas
Exemplo: Às vezes, o HTML é: <div id="1"> <div id="2"> this is the text i do NOT want </div> this is the text i want here </div>Outras vezes, é apenas: <div id="1"> this is the text i want here </div>Quero obter apenas o texto em uma tag e ...
Crie um snippet de conteúdo com o filtro Jinja
Quero criar snippets de conteúdo para minha página inicial. Um post de exemplo se parece com <p>Your favorite Harry Potter characters enter the Game of Thrones universe, and you'll never guess what happens!</p> <readmore/> <p>...they all ...
obter o atributo div val e o corpo do texto div
Aqui está um código pequeno para obter o valor de atributo div. Todos os nomes div são iguais com o mesmo nome attr. redditFile = urllib2.urlopen("http://www.bing.com/videos?q=owl") redditHtml = redditFile.read() redditFile.close() soup = ...
Como posso obter links href do HTML usando Python?
import urllib2 website = "WEBSITE" openwebsite = urllib2.urlopen(website) html = getwebsite.read() print htmlPor enquanto, tudo bem. Mas eu quero apenas links href do HTML de texto sem formatação. Como posso resolver este problema?
AttributeError ao extrair dados de uma URL em Python
Estou usando o código abaixo para tentar extrair os dados na tabela nesteURL [http://www.federalreserve.gov/econresdata/researchdata/feds200628_1.html]. No entanto, recebo a seguinte mensagem de erro: Error: `AttributeError: 'NoneType' object ...
Extrair links para determinada seção apenas do blogspot usando BeautifulSoup
Estou tentando extrair links para determinada seção apenas do Blogspot. Mas a saída mostra que os códigos extraem todo o link dentro da página. Aqui estão os códigos: import urlparse import urllib from bs4 import BeautifulSoup url ...
Como obter o conteúdo entre uma tag e terminar em HTML usando a bela sopa de python?
Eu tenho uma linha HTML da seguinte maneira: <span class="cd__headline-text">Is this model too thin for Yves Saint Laurent? </span>Gostaria de extrair o título, ou seja, "Este modelo é muito fino para Yves Saint Laurent?" desta linha HTML. Como ...
Analisar o código html para uma página da web inteira rolada para baixo
from bs4 import BeautifulSoup import urllib,sys reload(sys) sys.setdefaultencoding("utf-8") r = urllib.urlopen('https://twitter.com/ndtv').read() soup = BeautifulSoup(r)Isso me daria não toda a página da web rolada no final que eu quero, mas ...