Resultados da pesquisa a pedido "beautifulsoup"

2 a resposta

Desativar tratamento de atributo "classe" especial

A história: Quando você analisa HTML comBeautifulSoup, class atributo é considerado um atributo com vários valores [http://www.crummy.com/software/BeautifulSoup/bs4/doc/#searching-by-css-class]e é tratado de uma maneira especial: Lembre-se de ...

1 a resposta

Compreender a função Find () na sopa bonita

Eu sei o que estou tentando fazer é simples, mas está me causando pesar. Gostaria de extrair dados do HTML usando BeautifulSoup. Para fazer isso, preciso usar corretamente o.find() função. Aqui está o HTML com o qual estou trabalhando: <div ...

1 a resposta

<erro urlopen [Erro 1] _ssl.c: 510: erro: 14077417: SSL

Alguém sabe por que estou recebendo esse erro? SSLError: [Errno 1] _ssl.c:510: error:14077438:SSL routines:SSL23_GET_SERVER_HELLO:tlsv1Eu recebo o erro ao usar pedidos ou urllib2, estou executando o código no Kodi. O código funciona bem quando ...

4 a resposta

Baixe arquivos .xls de uma página da Web usando Python e BeautifulSoup

Eu quero baixar todos os.xls ou.xlsx ou.csv deste site para uma pasta especificada. https://www.rbi.org.in/Scripts/bs_viewcontent.aspx?Id=2009Eu procurei mecanizar, sopa bonita, urllib2 etc. O mecanizar não funciona no Python 3, o urllib2 ...

2 a resposta

Sopa bonita se a classe “contiver” ou Regex?

Se os nomes das minhas turmas são constantemente diferentes, digamos, por exemplo: listing-col-line-3-11 dpt 41 listing-col-block-1-22 dpt 41 listing-col-line-4-13 CWK 12Normalmente eu poderia fazer: for EachPart in soup.find_all("div", ...

1 a resposta

BeautifulSoup4 stripped_strings me dá objetos de bytes?

Estou tentando extrair o texto de uma citação em bloco que se parece com isso: <blockquote class="postcontent restore "> 01 Oyasumi <br></br> 02 DanSin' <br></br> 03 w.t.s. <br></br> 04 Lovism <br></br> 05 NoName <br></br> 06 Gakkou <br></br> 07 ...

1 a resposta

Localizando correspondências parciais em uma tag href

Estou tentando usar a sopa bonita para encontrar todas<a> elementos onde ohref O atributo inclui uma determinada sequência. Um exemplo do elemento completo é: <a href="/markets/NZSX/securities/ABA">ABA</a>Eu estou procurando por todos ...

1 a resposta

Raspagem na Web Python (Beautiful Soup, Selenium e PhantomJS): Raspando apenas parte da página inteira

Olá, estou com problemas para tentar coletar dados de um site para fins de modelagem (fantsylabs dotcom). Eu sou apenas um hack, então perdoe minha ignorância na linguagem da ficção científica. O que estou tentando realizar é ... Use o selênio ...

1 a resposta

Tentando usar Python e Selenium para rolar e raspar uma página da Web iterativamente

Recentemente, fiz uma pergunta (referenciada aqui:Raspagem na Web Python (Beautiful Soup, Selenium e PhantomJS): Raspando apenas parte da página ...

1 a resposta

Usando Python para raspar divs e extensões aninhadas no Twitter?

Estou tentando raspar os gostos e retweets dos resultados de uma pesquisa no Twitter. Depois de executar o Python abaixo, recebo uma lista vazia,[]. Não estou usando a API do Twitter, porque ela não olha para os tweets pela hashtag até aqui. O ...