Результаты поиска по запросу "html-parsing"
Почему Jsoup не может выбрать элемент td?
Я сделал небольшой тест (с Jsoup 1.6.1): String s = "" +Jsoup.parse("<td></td>").select("td").size(); System.out.println("Selected elements count : " + s);Это выводит: Selected elements count : 0Но он должен вернуть 1, потому что я ...
Как извлечь img src, title и alt из html с помощью php?
Я хотел бы создать страницу, где все изображения, которые находятся на моем сайте, перечислены с заголовком и альтернативным представлением. Я уже написал мне небольшую программу для поиска и загрузки всех HTML-файлов, но теперь я застрял в том, ...
BeautifulSoup - простой способ получения содержимого без HTML
Я использую этот код, чтобы найти все интересные ссылки на странице:
Селен - Получить элементы HTML, а не текстовое значение
С помощью этого кода я извлек весь нужный текст из HTML-документа
Этот трюк, кажется, работает и приводит к одной строке кода, но я не уверен, гарантированно ли это работает:
был моей первоначальной идеей в качестве решения, хотя вскоре стало очевидно, что парсер DOM будет более подходящим ... Я хотел бы преобразовать пробелы в между тегами PRE внутри строки текста HTML. Например: <table atrr="zxzx"><tr> ...
Я думаю, что это удалит все содержимое тега h2. Я просто хочу заменить имя тега и оставить все остальное без изменений.
ользую python + BeautifulSoup для разбора HTML-документа. Теперь мне нужно заменить все<h2 class="someclass"> элементы в документе HTML, с<h1 class="someclass">. Как я могу изменить имя тега, не меняя ничего в документе?
Извлечение выбранных столбцов из таблицы с помощью BeautifulSoup
Я пытаюсь извлечь первый и третий столбцыэта таблица данных используя BeautifulSoup. Посмотрев на HTML, первый столбец имеет