Resultados da pesquisa a pedido "beautifulsoup"

3 a resposta

BeautifulSoup: obtenha classes css de html

Existe uma maneira de obter classes CSS de um arquivo HTML usando BeautifulSoup? Exemplo de fragmento:

1 a resposta

Beautifulsoup não alcança um elemento filho

Eu escrevi o seguinte código tentando raspar uma página do Google Acadêmico import requests as req from bs4 import BeautifulSoup as soup url = r'https://scholar.google.com/scholar?hl=en&q=Sustainability and the measurement of wealth: further ...

2 a resposta

HTML renderizado para texto simples usando Python

3 a resposta

BeautifulSoup e ASP.NET/C#

Alguém integrou o BeautifulSoup ao ASP.NET/C# (possivelmente usando o IronPython ou não)? Existe uma alternativa BeautifulSoup ou uma porta que funcione bem com o ASP.NET/C# A intenção do planejamento de usar a biblioteca é extrairlegíveltexto ...

3 a resposta

Sugestões sobre get_text () em BeautifulSoup

Eu estou usando o BeautifulSoup para analisar algum conteúdo de uma página html.Eu posso extrair do html o conteúdo que eu quero (ou seja, o texto contido em um

1 a resposta

Análise de arquivo HTML em Python

1 a resposta

Raspagem na Web Python (Beautiful Soup, Selenium e PhantomJS): Raspando apenas parte da página inteira

Olá, estou com problemas para tentar coletar dados de um site para fins de modelagem (fantsylabs dotcom). Eu sou apenas um hack, então perdoe minha ignorância na linguagem da ficção científica. O que estou tentando realizar é ... Use o selênio ...

5 a resposta

UnicodeEncodeError: o codec 'charmap' não pode codificar caracteres

Estou tentando raspar um site, mas isso gera um erro. Estou usando o seguinte código: import urllib.request from bs4 import BeautifulSoup get = urllib.request.urlopen("https://www.website.com/") html = get.read() soup = BeautifulSoup(html) ...

1 a resposta

Como retornar html de uma página usando robobrowser

Estou experimentandohttp://robobrowser.readthedocs.org/en/latest/readme.html [http://robobrowser.readthedocs.org/en/latest/readme.html], uma nova biblioteca python baseada na bela biblioteca de sopas. Estou tentando testá-lo abrindo uma página ...

6 a resposta

Existe um InnerText equivalente no BeautifulSoup?

Com o código abaixo: soup = BeautifulSoup(page.read(), fromEncoding="utf-8") result = soup.find('div', {'class' :'flagPageTitle'})Eu recebo o seguinte html: <div id="ctl00_ContentPlaceHolder1_Item65404" class="flagPageTitle" style=" ...