Разбор HTML-элементов Java, сгенерированных JS

Question

Jul 25, 2016, 03:50 AM

html-parsing parsing java web-scraping jsoup

Разбор HTML-элементов Java, сгенерированных JS

Я очень новичок в разборе html с Java, ранее я использовал JSoup для анализа простого html без его динамического изменения, однако теперь мне нужно проанализировать веб-страницу с динамическими элементами. Это код, с которым я пытался проанализировать веб-страницу до этого, однако найти элементы было невозможно, поскольку они были добавлены после загрузки страницы. Ситуация в вопросе - это страница, которая использует карты Google с маркерами на нем, я пытаюсь почистить изображения этих маркеров.

    public static void main(String[] args) {
try {
    doc = Jsoup.connect("https://pokevision.com")
            .userAgent(
                    "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36")
            .get();
} catch (IOException e) {
    e.printStackTrace();
}
Elements images = doc.select("img[src~=(?i)\\.(png|jpe?g|gif)]");

for (Element image : images) {
    System.out.println("src : " + image.attr("src"));
}

}

Так как, очевидно, эта операция невозможна с JSoup, какие другие библиотеки я могу использовать, чтобы найти источники изображений.

Разбор HTML-элементов Java, сгенерированных JS

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Разбор HTML-элементов Java, сгенерированных JS

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы