Resultados da pesquisa a pedido "beautifulsoup"
Profundidade da primeira travessia na árvore de análise BeautifulSoup
Existe uma maneira de fazer uma DFT em uma árvore de análise BeautifulSoup? Eu estou tentando fazer algo como começar na raiz, geralmente, obter todos os elementos filhos e, em seguida, para cada elemento filho, obter seus filhos, etc., até ...
Analisando XML com Sopa Bonita
Editar: resolvido. Pensei em adicionar minha resposta na parte inferior ... Nota: a saída desejada é um monte de linhas como US D0591026Eu tenho dados parecidos com o seguinte em XML: <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE ...
Sopa bonita para analisar o URL para obter outros dados de URLs
Preciso analisar um URL para obter uma lista de URLs que apontam para uma página de detalhes. Então, a partir dessa página, preciso obter todos os detalhes dessa página. Preciso fazer dessa maneira, porque o URL da página de detalhes não ...
Solicite uma fonte html totalmente renderizada em javascript em um site e encontre todas as tags iframe
Atualmente, estou tentando usar selênio e BeautifulSoup para recuperar todas as tags iframe de um site. O problema é que eu não estou obtendo todos os iframes porque existem documentos html internos na página que o BS4 não está pesquisando e não ...
Como analisar xml em Python no Google App Engine
Por estaseguinte xml [http://www.boardgamegeek.com/xmlapi/boardgame/13], como faço para buscar o xml e analisá-lo para obter o valor de<age>? <boardgames> <boardgame objectid="13"> <yearpublished>1995</yearpublished> <minplayers>3</minplayers> ...
Python BeautifulSoup equivalente a lxml make_links_absolute
Portanto, o lxml possui um recurso muito útil: make_links_absolute: doc = lxml.html.fromstring(some_html_page) doc.make_links_absolute(url_for_some_html_page)e todos os links no documento são absolutos agora. Existe um equivalente fácil no ...
Beautifulsoup não alcança um elemento filho
Eu escrevi o seguinte código tentando raspar uma página do Google Acadêmico import requests as req from bs4 import BeautifulSoup as soup url = r'https://scholar.google.com/scholar?hl=en&q=Sustainability and the measurement of wealth: further ...
BeautifulSoup - modificando todos os links em um pedaço de HTML?
Eu preciso ser capaz de modificar todos os links em um documento HTML. Eu sei que preciso usar oSoupStrainer mas não sou 100% positivo em como implementá-lo. Se alguém pudesse me direcionar para um bom recurso ou fornecer um exemplo de código, ...
Não é possível obter dados da tabela - HTML
Estou tentando obter a 'Tabela de anúncios de ganhos' em: https://www.zacks.com/stock/research/amzn/earnings-announcements [https://www.zacks.com/stock/research/amzn/earnings-announcements] Estou usando diferentes opções de sopas bonitas, mas ...
BeautifulSoup: Como extraio todos os <li> s de uma lista de <ul> s que contém alguns <ul> s aninhados?
Meu código fonte se parece com: <h3>Header3 (Start here)</h3> <ul> <li>List items</li> <li>Etc...</li> </ul> <h3>Header 3</h3> <ul> <li>List items</li> <ul> <li>Nested list items</li> <li>Nested list items</li></ul> <li>List items</li> </ul> ...