Węzeł Jsdom Scrape Google's Reverse Image Search

Question

Dec 20, 2012, 01:28 PM

javascript jsdom node.js scrape httprequest

Węzeł Jsdom Scrape Google's Reverse Image Search

Chcę programowo znaleźć listę adresów URL podobnych obrazów z adresem URL obrazu. Nie mogę znaleźć żadnych darmowych interfejsów API do wyszukiwania obrazów, więc staram się to zrobić, zgarniając GoogleWyszukaj według obrazu.

Jeśli mam adres URL obrazu, powiedzmyhttp://i.imgur.com/oLmwq.png, a następnie nawigacja dohttps://www.google.com/searchbyimage?&image_url=http://i.imgur.com/oLmwq.png podaje powiązane obrazy i informacje.

Jak mogę uzyskaćjsdom.env aby stworzyć HTML, którego przeglądarka pobiera z powyższego adresu URL?

Oto, co próbowałem (CoffeeScript):

jsdom = require 'jsdom'
url = 'https://www.google.com/searchbyimage?&image_url=http://i.imgur.com/oLmwq.png'
jsdom.env
    html: url
    scripts: [ "http://code.jquery.com/jquery.js" ]
    features:
        FetchExternalResources: ['script']
        ProcessExternalResources: ['script']
    done: (errors, window) ->
        console.log window.$('body').html()

Możesz zobaczyć, że HTML nie pasuje do tego, co chcemy. Czy jest to problem z nagłówkami HTTP Jsdom?