Página JavaScript de raspagem da Web com Python

Question

Nov 08, 2011, 12:13 PM

Página JavaScript de raspagem da Web com Python

Estou tentando desenvolver um raspador de web simples. Quero extrair texto sem o código HTML. Na verdade, alcancei esse objetivo, mas vi que, em algumas páginas em que o JavaScript é carregado, não obtive bons resultado

Por exemplo, se algum código JavaScript adiciona algum texto, não consigo vê-lo, porque quando eu chamo

response = urllib2.urlopen(request)

Recebo o texto original sem o adicionado (porque o JavaScript é executado no cliente

ntão, estou procurando algumas idéias para resolver esse problem

questionAnswers(12)

Perguntas populares

0 a resposta

@MVC SessionStateAttribute não está funcionando como Atributo Global

0 a resposta

Converta o NSString em ASCII Binary Equivilent (e volte a um NSString novamente)

0 a resposta

Descubra se uma variável de ambiente contém uma substring

0 a resposta

Altere o plano de fundo do Terminal.app na linha de comando

0 a resposta

Gerenciador de pacotes no Visual Studio 2015 “407 (autenticação de proxy necessária)”

Você é muito ativo! É ótimo!

Página JavaScript de raspagem da Web com Python

questionAnswers(12)

yourAnswerToTheQuestion

Perguntas populares