Resultados da pesquisa a pedido "beautifulsoup"

2 a resposta

Profundidade da primeira travessia na árvore de análise BeautifulSoup

Existe uma maneira de fazer uma DFT em uma árvore de análise BeautifulSoup? Eu estou tentando fazer algo como começar na raiz, geralmente, obter todos os elementos filhos e, em seguida, para cada elemento filho, obter seus filhos, etc., até ...

2 a resposta

Analisando XML com Sopa Bonita

Editar: resolvido. Pensei em adicionar minha resposta na parte inferior ... Nota: a saída desejada é um monte de linhas como US D0591026Eu tenho dados parecidos com o seguinte em XML: <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE ...

3 a resposta

Sopa bonita para analisar o URL para obter outros dados de URLs

Preciso analisar um URL para obter uma lista de URLs que apontam para uma página de detalhes. Então, a partir dessa página, preciso obter todos os detalhes dessa página. Preciso fazer dessa maneira, porque o URL da página de detalhes não ...

1 a resposta

Solicite uma fonte html totalmente renderizada em javascript em um site e encontre todas as tags iframe

Atualmente, estou tentando usar selênio e BeautifulSoup para recuperar todas as tags iframe de um site. O problema é que eu não estou obtendo todos os iframes porque existem documentos html internos na página que o BS4 não está pesquisando e não ...

2 a resposta

Como analisar xml em Python no Google App Engine

Por estaseguinte xml [http://www.boardgamegeek.com/xmlapi/boardgame/13], como faço para buscar o xml e analisá-lo para obter o valor de<age>? <boardgames> <boardgame objectid="13"> <yearpublished>1995</yearpublished> <minplayers>3</minplayers> ...

1 a resposta

Python BeautifulSoup equivalente a lxml make_links_absolute

Portanto, o lxml possui um recurso muito útil: make_links_absolute: doc = lxml.html.fromstring(some_html_page) doc.make_links_absolute(url_for_some_html_page)e todos os links no documento são absolutos agora. Existe um equivalente fácil no ...

1 a resposta

Beautifulsoup não alcança um elemento filho

Eu escrevi o seguinte código tentando raspar uma página do Google Acadêmico import requests as req from bs4 import BeautifulSoup as soup url = r'https://scholar.google.com/scholar?hl=en&q=Sustainability and the measurement of wealth: further ...

3 a resposta

BeautifulSoup - modificando todos os links em um pedaço de HTML?

Eu preciso ser capaz de modificar todos os links em um documento HTML. Eu sei que preciso usar oSoupStrainer mas não sou 100% positivo em como implementá-lo. Se alguém pudesse me direcionar para um bom recurso ou fornecer um exemplo de código, ...

1 a resposta

Não é possível obter dados da tabela - HTML

Estou tentando obter a 'Tabela de anúncios de ganhos' em: https://www.zacks.com/stock/research/amzn/earnings-announcements [https://www.zacks.com/stock/research/amzn/earnings-announcements] Estou usando diferentes opções de sopas bonitas, mas ...

2 a resposta

BeautifulSoup: Como extraio todos os <li> s de uma lista de <ul> s que contém alguns <ul> s aninhados?

Meu código fonte se parece com: <h3>Header3 (Start here)</h3> <ul> <li>List items</li> <li>Etc...</li> </ul> <h3>Header 3</h3> <ul> <li>List items</li> <ul> <li>Nested list items</li> <li>Nested list items</li></ul> <li>List items</li> </ul> ...