Węzeł Jsdom Scrape Google's Reverse Image Search
Chcę programowo znaleźć listę adresów URL podobnych obrazów z adresem URL obrazu. Nie mogę znaleźć żadnych darmowych interfejsów API do wyszukiwania obrazów, więc staram się to zrobić, zgarniając GoogleWyszukaj według obrazu.
Jeśli mam adres URL obrazu, powiedzmyhttp://i.imgur.com/oLmwq.png, a następnie nawigacja dohttps://www.google.com/searchbyimage?&image_url=http://i.imgur.com/oLmwq.png podaje powiązane obrazy i informacje.
Jak mogę uzyskaćjsdom.env
aby stworzyć HTML, którego przeglądarka pobiera z powyższego adresu URL?
Oto, co próbowałem (CoffeeScript):
jsdom = require 'jsdom'
url = 'https://www.google.com/searchbyimage?&image_url=http://i.imgur.com/oLmwq.png'
jsdom.env
html: url
scripts: [ "http://code.jquery.com/jquery.js" ]
features:
FetchExternalResources: ['script']
ProcessExternalResources: ['script']
done: (errors, window) ->
console.log window.$('body').html()
Możesz zobaczyć, że HTML nie pasuje do tego, co chcemy. Czy jest to problem z nagłówkami HTTP Jsdom?