Resultados da pesquisa a pedido "beautifulsoup"

4 a resposta

IDs correspondentes em BeautifulSoup

Estou usando o BeautifulSoup - módulo python. Eu tenho que encontrar qualquer referência para o div com id como: 'post- #'. Por exemplo: <div id="post-45">...</div> <div id="post-334">...</div>Como posso filtrar isso? html = '<div ...

2 a resposta

beautifulsoup find_all bug?

Atualmente estou usando uma sopa bonita para analisar a página html. Mas, às vezes, o resultado obtido por find_all é menor que o número em páginas. Por exemplo, esta ...

2 a resposta

Python - beautifulsoup, aplique em todos os arquivos de texto na pasta e produza um novo arquivo de texto

Estou usando o seguinte código Python - Beautifulsoup para remover elementos html de um arquivo de texto: from bs4 import BeautifulSoup with open("textFileWithHtml.txt") as markup: soup = BeautifulSoup(markup.read()) with ...

3 a resposta

Importando o bs4 no Python 3.5

Eu instalei o Python 3.5 e o Beautifulsoup4. Quando tento importar o bs4, recebo o erro abaixo. Existe alguma correção para isso? Ou devo apenas instalar o Python 3.4? Por favor, seja muito explícito - eu sou novo em programação. ...

2 a resposta

Como capturar uma página da IMDb usando BeautifulSoup na Web

Eu sou novo no WebScraping / Python e BeautifulSoup e estou tendo dificuldades em fazer meu código funcionar. Gostaria de raspar o URL:http://m.imdb.com/feature/bornondate [http://m.imdb.com/feature/bornondate]"para obter o: Nome da ...

2 a resposta

raspando uma resposta de uma opção selecionada na lista suspensa

Este é um exemplo de página que lista as estatísticas de beisebol de um jogador selecionado, por padrão no ano mais recente (2014, em breve em ...

2 a resposta

Raspagem na web da Amazon

Estou tentando reduzir os preços da Amazon com phantomjs e python. Quero analisá-lo com uma bela sopa, para obter preços novos e usados para livros, o problema é: quando passo a fonte da solicitação que faço com phantomjs, os preços são apenas ...

1 a resposta

Como baixar PDFs de links raspados [Python]?

Estou trabalhando na criação de um Rascunho da Web em PDF em Python. Essencialmente, estou tentando raspar todas as notas de aula de um dos meus cursos, que estão na forma de PDFs. Quero inserir um URL e, em seguida, obter os PDFs e salvá-los em ...

4 a resposta

BeautifulSoup: basta entrar em uma tag, não importa quantas tags anexas existam

Estou tentando raspar todo o html interno do<p> elementos em uma página da web usando o BeautifulSoup. Existem tags internas, mas não me importo, só quero obter o texto interno. Por exemplo, para: <p>Red</p> <p><i>Blue</i></p> <p>Yellow</p> ...

2 a resposta

Localizando vários atributos na tag span em Python

Existem dois valores que pretendo copiar de um site. Eles estão presentes nas seguintes tags: <span class="sp starBig">4.1</span> <span class="sp starGryB">2.9</span>Eu preciso dos valores sp starBig, sp starGryB. A expressão findAll que estou ...