Resultados da pesquisa a pedido "beautifulsoup"
Beautifulsoup não alcança um elemento filho
Eu escrevi o seguinte código tentando raspar uma página do Google Acadêmico import requests as req from bs4 import BeautifulSoup as soup url = r'https://scholar.google.com/scholar?hl=en&q=Sustainability and the measurement of wealth: further ...
Analisando XML com Sopa Bonita
Editar: resolvido. Pensei em adicionar minha resposta na parte inferior ... Nota: a saída desejada é um monte de linhas como US D0591026Eu tenho dados parecidos com o seguinte em XML: <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE ...
Raspando o Google Finance (BeautifulSoup)
Estou tentando raspar o Google Finance e obter a tabela "Ações relacionadas", com o ID "cc-table" e a classe "gf-table" com base no inspetor de páginas da web no Chrome. (Link de ...
Analisando uma tag de script com dicts no BeautifulSoup
Trabalhando em uma resposta parcial paraesta [https://stackoverflow.com/questions/44957324/python-issue-scraping-with-beautifulsoup/44960710#44960710] pergunta, me deparei com umbs4.element.Tag isso é uma bagunça de dict e listas aninhados (s, ...
Imagem de raspagem da Web dentro da tela
Estou raspando uma página na web onde, com vários números, aparece também imagens de gráficos de preços pequenos. Se eu clicar nessas imagens dentro do navegador, posso salvar esse gráfico como um.png imagem. Quando olho para o código-fonte, ...
urllib.request.urlopen (url) com autenticação
Eu tenho jogado com uma bela sopa e analisando páginas da web há alguns dias. Eu tenho usado uma linha de código que foi minha salvadora em todos os scripts que escrevo. A linha de código é: r = requests.get('some_url', auth=('my_username', ...
beautifulsoup analisa todos os arquivos html em uma pasta webscrapping [closed]
Minha tarefa é ler todos os arquivos html de um diretório. As condições são para descobrir se cada arquivo contém tags (1) <strong>OO</strong> (2) <strong>QQ</strong>Então
BeautifulSoup - extrai json de JS
Estou brincando com o BeautilfulSoup e procurando uma maneira de obter uma string json específica dentro de um elemento JS. Aqui está o JS: <script>window.pinball = window.pinball || []; ...
BeautifulSoup4 não pode ser instalado no python3.5 no Windows7
Eu baixei beautifulsoup4-4.5.3.tar.gz de https://www.crummy.com/software/BeautifulSoup/bs4/download/4.5/ [https://www.crummy.com/software/BeautifulSoup/bs4/download/4.5/]e descompacte-o no meu diretório de trabalho python (que énãomeu diretório ...
sopa bonita, eliminando certos itens com Findall ()
Eu tenho uma série de itens de lista retornados por find_all () <li class="rsltItem" mh-property-list-item="".......O item possui muitos elementos aninhados. De vez em quando, um dos li é um pouco diferente: <li class="rsltItem adv" ...