Resultados da pesquisa a pedido "beautifulsoup"
BeautifulSoup: obtenha classes css de html
Existe uma maneira de obter classes CSS de um arquivo HTML usando BeautifulSoup? Exemplo de fragmento:
Beautifulsoup não alcança um elemento filho
Eu escrevi o seguinte código tentando raspar uma página do Google Acadêmico import requests as req from bs4 import BeautifulSoup as soup url = r'https://scholar.google.com/scholar?hl=en&q=Sustainability and the measurement of wealth: further ...
BeautifulSoup e ASP.NET/C#
Alguém integrou o BeautifulSoup ao ASP.NET/C# (possivelmente usando o IronPython ou não)? Existe uma alternativa BeautifulSoup ou uma porta que funcione bem com o ASP.NET/C# A intenção do planejamento de usar a biblioteca é extrairlegíveltexto ...
Sugestões sobre get_text () em BeautifulSoup
Eu estou usando o BeautifulSoup para analisar algum conteúdo de uma página html.Eu posso extrair do html o conteúdo que eu quero (ou seja, o texto contido em um
Raspagem na Web Python (Beautiful Soup, Selenium e PhantomJS): Raspando apenas parte da página inteira
Olá, estou com problemas para tentar coletar dados de um site para fins de modelagem (fantsylabs dotcom). Eu sou apenas um hack, então perdoe minha ignorância na linguagem da ficção científica. O que estou tentando realizar é ... Use o selênio ...
UnicodeEncodeError: o codec 'charmap' não pode codificar caracteres
Estou tentando raspar um site, mas isso gera um erro. Estou usando o seguinte código: import urllib.request from bs4 import BeautifulSoup get = urllib.request.urlopen("https://www.website.com/") html = get.read() soup = BeautifulSoup(html) ...
Como retornar html de uma página usando robobrowser
Estou experimentandohttp://robobrowser.readthedocs.org/en/latest/readme.html [http://robobrowser.readthedocs.org/en/latest/readme.html], uma nova biblioteca python baseada na bela biblioteca de sopas. Estou tentando testá-lo abrindo uma página ...
Existe um InnerText equivalente no BeautifulSoup?
Com o código abaixo: soup = BeautifulSoup(page.read(), fromEncoding="utf-8") result = soup.find('div', {'class' :'flagPageTitle'})Eu recebo o seguinte html: <div id="ctl00_ContentPlaceHolder1_Item65404" class="flagPageTitle" style=" ...