Resultados da pesquisa a pedido "beautifulsoup"

2 a resposta

Beautiful Soup Find - obtenha apenas o texto

Eu tinha esse código cuspindo apenas o preço como uma string (125.01), mas devo ter mudado alguma coisa, porque agora ele imprime toda a linha com as tags html e tudo mais. Como posso imprimir apenas o texto, sem usar expressões ...

1 a resposta

Sintaxe inválida do BeautifulSoup no Python 3.4 (após 2to3.py)

Estou tentando instalar o Beautiful Soup 4 no Python 3.4. Instalei-o na linha de comando (recebi o erro de sintaxe inválido porque não o havia convertido), executei o2to3.py script de conversão parabs4 e agora recebo um novo erro de sintaxe ...

2 a resposta

Obter texto de tags HTML sem texto de tags filho internas

Exemplo: Às vezes, o HTML é: <div id="1"> <div id="2"> this is the text i do NOT want </div> this is the text i want here </div>Outras vezes, é apenas: <div id="1"> this is the text i want here </div>Quero obter apenas o texto em uma tag e ...

1 a resposta

Crie um snippet de conteúdo com o filtro Jinja

Quero criar snippets de conteúdo para minha página inicial. Um post de exemplo se parece com <p>Your favorite Harry Potter characters enter the Game of Thrones universe, and you'll never guess what happens!</p> <readmore/> <p>...they all ...

1 a resposta

obter o atributo div val e o corpo do texto div

Aqui está um código pequeno para obter o valor de atributo div. Todos os nomes div são iguais com o mesmo nome attr. redditFile = urllib2.urlopen("http://www.bing.com/videos?q=owl") redditHtml = redditFile.read() redditFile.close() soup = ...

8 a resposta

Como posso obter links href do HTML usando Python?

import urllib2 website = "WEBSITE" openwebsite = urllib2.urlopen(website) html = getwebsite.read() print htmlPor enquanto, tudo bem. Mas eu quero apenas links href do HTML de texto sem formatação. Como posso resolver este problema?

2 a resposta

AttributeError ao extrair dados de uma URL em Python

Estou usando o código abaixo para tentar extrair os dados na tabela nesteURL [http://www.federalreserve.gov/econresdata/researchdata/feds200628_1.html]. No entanto, recebo a seguinte mensagem de erro: Error: `AttributeError: 'NoneType' object ...

2 a resposta

Extrair links para determinada seção apenas do blogspot usando BeautifulSoup

Estou tentando extrair links para determinada seção apenas do Blogspot. Mas a saída mostra que os códigos extraem todo o link dentro da página. Aqui estão os códigos: import urlparse import urllib from bs4 import BeautifulSoup url ...

2 a resposta

Como obter o conteúdo entre uma tag e terminar em HTML usando a bela sopa de python?

Eu tenho uma linha HTML da seguinte maneira: <span class="cd__headline-text">Is this model too thin for Yves Saint Laurent? </span>Gostaria de extrair o título, ou seja, "Este modelo é muito fino para Yves Saint Laurent?" desta linha HTML. Como ...

1 a resposta

Analisar o código html para uma página da web inteira rolada para baixo

from bs4 import BeautifulSoup import urllib,sys reload(sys) sys.setdefaultencoding("utf-8") r = urllib.urlopen('https://twitter.com/ndtv').read() soup = BeautifulSoup(r)Isso me daria não toda a página da web rolada no final que eu quero, mas ...