Resultados da pesquisa a pedido "beautifulsoup"
O objeto BeautifulSoup não escapa, faz com que o intérprete caia silenciosamente
Eu tenho uma sopa deBeautifulSoup que eu não posso conservar. Quando tento selecionar o objeto, o intérprete python trava silenciosamente (de modo que não possa ser tratado como uma exceção). Eu tenho que poder escolher o objeto para retornar o ...
selecionando o segundo filho em uma bela sopa com soup.select?
Eu tenho: <h2 id='names'>Names</h2> <p>John</p> <p>Peter</p>Agora, qual é a maneira mais fácil de obter o Peter aqui, se eu já tiver a tag h2? Agora eu tentei: soup.select("#names > p:nth-child(1)")mas aqui eu recebo o ...
Obter documento DOCTYPE com BeautifulSoup
Eu apenas comecei a mexer comraspar [http://scrapy.org/]em conjunção com BeautifulSoup [http://www.crummy.com/software/BeautifulSoup/]e estou me perguntando se estou perdendo algo muito óbvio, mas não consigo descobrir como obter o doctype de um ...
Tabela HTML de análise de Python gerada por JavaScript
Estou tentando raspar uma tabela no site da NYSE ( http://www1.nyse.com/about/listed/IPO_Index.html [http://www1.nyse.com/about/listed/IPO_Index.html]) em um dataframe de pandas. Para fazer isso, eu tenho uma configuração como esta: def ...
BeautifulSoup: não adicione espaços onde eles importam, remova-os onde não importam
Este exemplo de programa python: document='''<p>This is <i>something</i>, it happens in <b>real</b> life</p>''' from bs4 import BeautifulSoup soup = BeautifulSoup(document) print(soup.prettify())produz a seguinte saída: <html> <body> <p> This ...
Como obter HTML de um belo objeto de sopa
Eu tenho a seguinte lista de objetos bs4: >>> listing <div class="listingHeader"> <h2> .... >>> type(listing) <class 'bs4.element.Tag'>Eu quero extrair o html bruto como uma string. Eu tentei: >>> a = listing.contents >>> type(a) <type ...
Usando solicitações e BeautifulSoup - Python retorna a tag sem texto
Estou tentando capturar o número de visitas nesta página, mas python retorna a tag sem texto. Isto é o que eu fiz. import requests from bs4 import BeautifulSoup r ...
BeautifulSoup extrai o caminho XPATH ou CSS do nó
Desejo extrair alguns dados do HTML e poder destacar os elementos extraídos no lado do cliente sem modificar o html de origem. E XPath ou CSS Path parece ótimo para isso.É possível extrair XPATH ou CSS Path diretamente do BeautifulSoup? No ...
BeautifulSoup se comporta de maneira diferente na máquina Amazon EC2
Estou executando o seguinte script: from bs4 import BeautifulSoup import urllib2 import sys print sys.version url = 'https://www.google.com/finance' page = urllib2.urlopen(url).read() soup = BeautifulSoup(page) trends_tag = soup.find('div', ...
Extrair conteúdo de <Script com BeautifulSoup
1 / Estou tentando extrair uma parte do script usando uma bela sopa, mas ela imprime Nothing. O que há de errado ? URL = "http://www.reuters.com/video/2014/08/30/woman-who-drank-restaurants-tainted-tea?videoId=341712453" oururl= ...