Resultados da pesquisa a pedido "scrapy"

3 a resposta

Scrapy, tag hash nos URLs

Estou no meio de um projeto de demolição usando o Scrap Eu percebi que o Scrapy retira o URL de uma tag hash até o fina Aqui está a saída do shell: [s] request ...

2 a resposta

Ordem de middleware Scrapy

Scrapydocumentaçã [http://doc.scrapy.org/topics/downloader-middleware.html#activating-a-downloader-middleware] diz: o primeiro middleware é o mais próximo do mecanismo e o último é o mais próximo do downloade Para decidir qual ordem atribuir ...

3 a resposta

Clique em um botão no Scrapy

Estou usando o Scrapy para rastrear uma página da web. Algumas das informações necessárias apenas aparecem quando você clica em um determinado botão (é claro que também aparece no código HTML depois de clicar). Eu descobri que o Scrapy pode ...

3 a resposta

Devo criar um pipeline para salvar arquivos com scrapy?

Preciso salvar um arquivo (.pdf), mas não tenho certeza de como fazê-lo. Preciso salvar .pdfs e armazená-los de forma que eles sejam organizados em diretórios, da mesma forma que são armazenados no site em que estou raspand Pelo que consigo ...

2 a resposta

Evitando o redirecionamento

Estou tentando analisar um site (escrito em ASP) e o rastreador é redirecionado para o site principal. Mas o que eu gostaria de fazer é analisar o URL fornecido, não o redirecionado. Existe uma maneira de fazer isso? Tentei adicionar "REDIRECT = ...

4 a resposta

xecutando tarefas Scrapy em Pyth

Meu script Scrapy parece funcionar muito bem quando eu o executo em cenários 'únicos' na linha de comando, mas se eu tentar executar o código duas vezes na mesma sessão python, recebo este erro: "ReactorNotRestartable" Por quê O código ...

2 a resposta

Como combinar scrapy e htmlunit para rastrear URLs com javascript

Estou trabalhando no Scrapy para rastrear páginas, no entanto, não consigo lidar com as páginas com javascript. As pessoas sugerem que eu use a unidade html, então eu a instalei, mas não sei como usá-la. Alguém pode dar um exemplo (scrapy + ...

1 a resposta

sando o tor com estrutura fragmenta

Estou tentando rastrear o site, que é sofisticado o suficiente para interromper os bots, quero dizer, está permitindo apenas alguns pedidos, depois que o Scrapy trav Pergunta 1: existe uma maneira, se o Scrapy travar, posso reiniciar ...

3 a resposta

Scrapy ler lista de URLs do arquivo para raspa

Acabei de instalar o scrapy e segui seu dmoz simplestutoria [http://doc.scrapy.org/en/latest/intro/tutorial.html] que funciona. Eu apenas procurei o manuseio básico de arquivos para python e tentei fazer o rastreador ler uma lista de URLs de um ...

4 a resposta

como mesclar os resultados da página de destino para a página atual em scrapy?

Precisa de exemplo detalhado sobre como obter um link de uma página, siga este link, obtenha mais informações da página vinculada e volte a juntar alguns dados da primeira página ... obrigad