Node Jsdom Scrape Googles Reverse Image Search
Ich möchte programmgesteuert eine Liste von URLs für ähnliche Bilder finden, wenn eine Bild-URL angegeben ist. Ich kann keine freien Bildsuch-APIs finden, daher versuche ich, die von Google zu entfernenSuche nach Bild.
Wenn ich eine Bild-URL habe, sagen wirhttp://i.imgur.com/oLmwq.pngund navigieren Sie dann zuhttps://www.google.com/searchbyimage?&image_url=http://i.imgur.com/oLmwq.png gibt verwandte Bilder und Infos.
Wie bekomme ichjsdom.env
um das HTML zu erzeugen, das Ihr Browser von der oben genannten URL erhält?
Folgendes habe ich versucht (CoffeeScript):
jsdom = require 'jsdom'
url = 'https://www.google.com/searchbyimage?&image_url=http://i.imgur.com/oLmwq.png'
jsdom.env
html: url
scripts: [ "http://code.jquery.com/jquery.js" ]
features:
FetchExternalResources: ['script']
ProcessExternalResources: ['script']
done: (errors, window) ->
console.log window.$('body').html()
Sie können sehen, dass der HTML-Code nicht mit dem übereinstimmt, was wir möchten. Ist dies ein Problem mit den HTTP-Headern von Jsdom?