Resultados da pesquisa a pedido "beautifulsoup"
Desativar tratamento de atributo "classe" especial
A história: Quando você analisa HTML comBeautifulSoup, class atributo é considerado um atributo com vários valores [http://www.crummy.com/software/BeautifulSoup/bs4/doc/#searching-by-css-class]e é tratado de uma maneira especial: Lembre-se de ...
Compreender a função Find () na sopa bonita
Eu sei o que estou tentando fazer é simples, mas está me causando pesar. Gostaria de extrair dados do HTML usando BeautifulSoup. Para fazer isso, preciso usar corretamente o.find() função. Aqui está o HTML com o qual estou trabalhando: <div ...
<erro urlopen [Erro 1] _ssl.c: 510: erro: 14077417: SSL
Alguém sabe por que estou recebendo esse erro? SSLError: [Errno 1] _ssl.c:510: error:14077438:SSL routines:SSL23_GET_SERVER_HELLO:tlsv1Eu recebo o erro ao usar pedidos ou urllib2, estou executando o código no Kodi. O código funciona bem quando ...
Baixe arquivos .xls de uma página da Web usando Python e BeautifulSoup
Eu quero baixar todos os.xls ou.xlsx ou.csv deste site para uma pasta especificada. https://www.rbi.org.in/Scripts/bs_viewcontent.aspx?Id=2009Eu procurei mecanizar, sopa bonita, urllib2 etc. O mecanizar não funciona no Python 3, o urllib2 ...
Sopa bonita se a classe “contiver” ou Regex?
Se os nomes das minhas turmas são constantemente diferentes, digamos, por exemplo: listing-col-line-3-11 dpt 41 listing-col-block-1-22 dpt 41 listing-col-line-4-13 CWK 12Normalmente eu poderia fazer: for EachPart in soup.find_all("div", ...
BeautifulSoup4 stripped_strings me dá objetos de bytes?
Estou tentando extrair o texto de uma citação em bloco que se parece com isso: <blockquote class="postcontent restore "> 01 Oyasumi <br></br> 02 DanSin' <br></br> 03 w.t.s. <br></br> 04 Lovism <br></br> 05 NoName <br></br> 06 Gakkou <br></br> 07 ...
Localizando correspondências parciais em uma tag href
Estou tentando usar a sopa bonita para encontrar todas<a> elementos onde ohref O atributo inclui uma determinada sequência. Um exemplo do elemento completo é: <a href="/markets/NZSX/securities/ABA">ABA</a>Eu estou procurando por todos ...
Raspagem na Web Python (Beautiful Soup, Selenium e PhantomJS): Raspando apenas parte da página inteira
Olá, estou com problemas para tentar coletar dados de um site para fins de modelagem (fantsylabs dotcom). Eu sou apenas um hack, então perdoe minha ignorância na linguagem da ficção científica. O que estou tentando realizar é ... Use o selênio ...
Tentando usar Python e Selenium para rolar e raspar uma página da Web iterativamente
Recentemente, fiz uma pergunta (referenciada aqui:Raspagem na Web Python (Beautiful Soup, Selenium e PhantomJS): Raspando apenas parte da página ...
Usando Python para raspar divs e extensões aninhadas no Twitter?
Estou tentando raspar os gostos e retweets dos resultados de uma pesquisa no Twitter. Depois de executar o Python abaixo, recebo uma lista vazia,[]. Não estou usando a API do Twitter, porque ela não olha para os tweets pela hashtag até aqui. O ...