Resultados da pesquisa a pedido "beautifulsoup"
IDs correspondentes em BeautifulSoup
Estou usando o BeautifulSoup - módulo python. Eu tenho que encontrar qualquer referência para o div com id como: 'post- #'. Por exemplo: <div id="post-45">...</div> <div id="post-334">...</div>Como posso filtrar isso? html = '<div ...
beautifulsoup find_all bug?
Atualmente estou usando uma sopa bonita para analisar a página html. Mas, às vezes, o resultado obtido por find_all é menor que o número em páginas. Por exemplo, esta ...
Python - beautifulsoup, aplique em todos os arquivos de texto na pasta e produza um novo arquivo de texto
Estou usando o seguinte código Python - Beautifulsoup para remover elementos html de um arquivo de texto: from bs4 import BeautifulSoup with open("textFileWithHtml.txt") as markup: soup = BeautifulSoup(markup.read()) with ...
Importando o bs4 no Python 3.5
Eu instalei o Python 3.5 e o Beautifulsoup4. Quando tento importar o bs4, recebo o erro abaixo. Existe alguma correção para isso? Ou devo apenas instalar o Python 3.4? Por favor, seja muito explícito - eu sou novo em programação. ...
Como capturar uma página da IMDb usando BeautifulSoup na Web
Eu sou novo no WebScraping / Python e BeautifulSoup e estou tendo dificuldades em fazer meu código funcionar. Gostaria de raspar o URL:http://m.imdb.com/feature/bornondate [http://m.imdb.com/feature/bornondate]"para obter o: Nome da ...
raspando uma resposta de uma opção selecionada na lista suspensa
Este é um exemplo de página que lista as estatísticas de beisebol de um jogador selecionado, por padrão no ano mais recente (2014, em breve em ...
Raspagem na web da Amazon
Estou tentando reduzir os preços da Amazon com phantomjs e python. Quero analisá-lo com uma bela sopa, para obter preços novos e usados para livros, o problema é: quando passo a fonte da solicitação que faço com phantomjs, os preços são apenas ...
Como baixar PDFs de links raspados [Python]?
Estou trabalhando na criação de um Rascunho da Web em PDF em Python. Essencialmente, estou tentando raspar todas as notas de aula de um dos meus cursos, que estão na forma de PDFs. Quero inserir um URL e, em seguida, obter os PDFs e salvá-los em ...
BeautifulSoup: basta entrar em uma tag, não importa quantas tags anexas existam
Estou tentando raspar todo o html interno do<p> elementos em uma página da web usando o BeautifulSoup. Existem tags internas, mas não me importo, só quero obter o texto interno. Por exemplo, para: <p>Red</p> <p><i>Blue</i></p> <p>Yellow</p> ...
Localizando vários atributos na tag span em Python
Existem dois valores que pretendo copiar de um site. Eles estão presentes nas seguintes tags: <span class="sp starBig">4.1</span> <span class="sp starGryB">2.9</span>Eu preciso dos valores sp starBig, sp starGryB. A expressão findAll que estou ...