Я думаю, что это слишком просто. Многие URL-адреса похожи на /generateImage.php?name=test, который может быть любым графическим форматом. Я думаю, что мне нужно каким-то образом получить саму ссылку.

ользую Java API Selenium 2 для взаимодействия с веб-страницами. У меня вопрос: как я могу определить тип содержимого адресатов ссылок?

По сути, это фон: перед тем, как щелкнуть ссылку, я хочу убедиться, что ответ является HTML-файлом. Если нет, мне нужно разобраться с этим по-другому. Итак, допустим, есть ссылка для скачивания PDF-файла. Приложение должно непосредственно читать содержимое этого URL, а не открывать его в браузере.

Цель состоит в том, чтобы иметь приложение, которое автоматически знает, является ли текущее местоположение HTML, PDF, XML или любым другим, чтобы использовать соответствующие парсеры для извлечения полезной информации из документов.

Обновить

Добавленная награда: вознаградит ее за лучшее решение, которое позволит мне получить тип контента для данного URL.

Ответы на вопрос(3)

Ваш ответ на вопрос