Определить и извлечь название / описание изображения (Data Scraping Pinterest)
Как можно использовать Javascript / jQuery для идентификации описания или заголовка, соответствующего изображению на веб-странице с несколькими изображениями и описаниями?
Заголовок страницы может быть извлечен очень легко, но заголовок может не соответствовать изображению, особенно если на странице много изображений.
var title = document.title;
Я полагаю, что это было успешно сделано букмарклетом Pinterest Pin-it. Я предполагаю, что это связано с алгоритмом, чтобы найти ближайшийh1
, h2
, h3
или изображениеalt
атрибуты, а затем отступить кdocument.title
если алгоритм не может определить описание изображения на странице.
Любые идеи с благодарностью!
РЕДАКТИРОВАТЬЭто для очистки данных других сайтов