Node Jsdom Scrape Pesquisa de Imagens Reversas do Google
Quero encontrar uma lista de URLs para imagens semelhantes, de acordo com o URL da imagem. Não consigo encontrar nenhuma API de pesquisa de imagens gratuitas, por isso estou tentando fazer isso raspando o GooglePesquisar por imagem.
Se eu tiver um URL de imagem, digamoshttp://i.imgur.com/oLmwq.png, em seguida, navegando parahttps://www.google.com/searchbyimage?&image_url=http://i.imgur.com/oLmwq.png fornece imagens e informações relacionadas.
Como eu consigojsdom.env
para produzir o HTML que seu navegador recebe do URL acima?
Aqui está o que eu tentei (CoffeeScript):
jsdom = require 'jsdom'
url = 'https://www.google.com/searchbyimage?&image_url=http://i.imgur.com/oLmwq.png'
jsdom.env
html: url
scripts: [ "http://code.jquery.com/jquery.js" ]
features:
FetchExternalResources: ['script']
ProcessExternalResources: ['script']
done: (errors, window) ->
console.log window.$('body').html()
Você pode ver que o HTML não corresponde ao que queremos. Isso é um problema com os cabeçalhos HTTP do Jsdom?