Resultados da pesquisa a pedido "scrapy"

0 a resposta

Aranha raspada envia sinal spider_close antes de fechar

Eu tenho uma aranha que usa um arquivo como parâmetro, esse arquivo contém os xpaths. A aranha analisa o arquivo, obtém os xpaths e começa a rastrear. Tudo está funcionando bem Agora, quero executar essa aranha várias vezes, então fiz ...

0 a resposta

Importar arquivo de itens em outro script em python

Estou tentando fazer o seguinte: Uma aranha raspa os links presentes na página de um site.Ele salva os links em um arquivo de texto.Outra aranha agora abre o arquivo de texto e lê os links, raspa as páginas da web individuais e salva os dados.Eu ...

0 a resposta

Inicializando objeto de pipeline com rastreador em scrapy

Baseado emScrapy: organização do programa ao interagir com o site secundário [https://stackoverflow.com/questions/42476106/scrapy-program-organization-when-interacting-with-secondary-website] , Eu tenho: class MyPipeline(object): def ...

0 a resposta

Scrapy: construindo uma lista não duplicada de caminhos absolutos a partir de caminhos relativos

Pergunta, questão: como uso o Scrapy para criar uma lista não duplicada de caminhos absolutos a partir de caminhos relativos sob oimg srcetiqueta, rótulo, palavra-chave? fundo: Estou tentando usar o Scrapy para rastrear um site, puxe todos os ...

0 a resposta

Python Como podemos executar a função spider do Scrapy com base em uma condição

Eu tenho uma função multiprocesso em Python, conforme descrito abaixo no Scrapy, que precisa ser corrigido. Você poderia verificar run_spider () primeiro para que não funcione se response.css ('div.quote') O resultado estiver em branco? ...

1 a resposta

Instalação escamosa no Leão OSX

Então, estou tentando instalar o Scrapy no Lion e não tenho certeza se ele está instalado corretamente ou não.Eu segui o guia aquihttp://doc.scrapy.org/en/la...

1 a resposta

Scrapy não rastreando páginas subseqüentes em ordem

Estou escrevendo um rastreador para obter os nomes dos itens de um site. O site tem 25 itens por página e várias páginas (200 para alguns tipos de itens).Aqu...

1 a resposta

Scrapy - Rastrear várias páginas por item

Eu estou tentando rastrear algumas páginas extras por item para pegar algumas informações de localização.No final do item antes do retorno, verifico se preci...

1 a resposta

Gravando o tempo total gasto para executar uma aranha em escamoso

Eu estou usando scrapy para desfazer um siteEu tinha escrito uma aranha e buscado todos os itens da página e salvo em um arquivo csv, e agora eu quero salvar o

1 a resposta

Não é possível definir o middleware do downloader personalizado no Scrapy