Resultados da pesquisa a pedido "beautifulsoup"

3 a resposta

O objeto BeautifulSoup não escapa, faz com que o intérprete caia silenciosamente

Eu tenho uma sopa deBeautifulSoup que eu não posso conservar. Quando tento selecionar o objeto, o intérprete python trava silenciosamente (de modo que não possa ser tratado como uma exceção). Eu tenho que poder escolher o objeto para retornar o ...

2 a resposta

selecionando o segundo filho em uma bela sopa com soup.select?

Eu tenho: <h2 id='names'>Names</h2> <p>John</p> <p>Peter</p>Agora, qual é a maneira mais fácil de obter o Peter aqui, se eu já tiver a tag h2? Agora eu tentei: soup.select("#names > p:nth-child(1)")mas aqui eu recebo o ...

3 a resposta

Obter documento DOCTYPE com BeautifulSoup

Eu apenas comecei a mexer comraspar [http://scrapy.org/]em conjunção com BeautifulSoup [http://www.crummy.com/software/BeautifulSoup/]e estou me perguntando se estou perdendo algo muito óbvio, mas não consigo descobrir como obter o doctype de um ...

1 a resposta

Tabela HTML de análise de Python gerada por JavaScript

Estou tentando raspar uma tabela no site da NYSE ( http://www1.nyse.com/about/listed/IPO_Index.html [http://www1.nyse.com/about/listed/IPO_Index.html]) em um dataframe de pandas. Para fazer isso, eu tenho uma configuração como esta: def ...

3 a resposta

BeautifulSoup: não adicione espaços onde eles importam, remova-os onde não importam

Este exemplo de programa python: document='''<p>This is <i>something</i>, it happens in <b>real</b> life</p>''' from bs4 import BeautifulSoup soup = BeautifulSoup(document) print(soup.prettify())produz a seguinte saída: <html> <body> <p> This ...

1 a resposta

Como obter HTML de um belo objeto de sopa

Eu tenho a seguinte lista de objetos bs4: >>> listing <div class="listingHeader"> <h2> .... >>> type(listing) <class 'bs4.element.Tag'>Eu quero extrair o html bruto como uma string. Eu tentei: >>> a = listing.contents >>> type(a) <type ...

1 a resposta

Usando solicitações e BeautifulSoup - Python retorna a tag sem texto

Estou tentando capturar o número de visitas nesta página, mas python retorna a tag sem texto. Isto é o que eu fiz. import requests from bs4 import BeautifulSoup r ...

2 a resposta

BeautifulSoup extrai o caminho XPATH ou CSS do nó

Desejo extrair alguns dados do HTML e poder destacar os elementos extraídos no lado do cliente sem modificar o html de origem. E XPath ou CSS Path parece ótimo para isso.É possível extrair XPATH ou CSS Path diretamente do BeautifulSoup? No ...

1 a resposta

BeautifulSoup se comporta de maneira diferente na máquina Amazon EC2

Estou executando o seguinte script: from bs4 import BeautifulSoup import urllib2 import sys print sys.version url = 'https://www.google.com/finance' page = urllib2.urlopen(url).read() soup = BeautifulSoup(page) trends_tag = soup.find('div', ...

1 a resposta

Extrair conteúdo de <Script com BeautifulSoup

1 / Estou tentando extrair uma parte do script usando uma bela sopa, mas ela imprime Nothing. O que há de errado ? URL = "http://www.reuters.com/video/2014/08/30/woman-who-drank-restaurants-tainted-tea?videoId=341712453" oururl= ...