Результаты поиска по запросу "html-parsing"

3 ответа

Почему Jsoup не может выбрать элемент td?

Я сделал небольшой тест (с Jsoup 1.6.1): String s = "" +Jsoup.parse("<td></td>").select("td").size(); System.out.println("Selected elements count : " + s);Это выводит: Selected elements count : 0Но он должен вернуть 1, потому что я ...

2 ответа

HTML-теги Agility Pack НЕ ВХОДЯТ в белый список

21 ответ

Как извлечь img src, title и alt из html с помощью php?

Я хотел бы создать страницу, где все изображения, которые находятся на моем сайте, перечислены с заголовком и альтернативным представлением. Я уже написал мне небольшую программу для поиска и загрузки всех HTML-файлов, но теперь я застрял в том, ...

ТОП публикаций

2 ответа

BeautifulSoup - простой способ получения содержимого без HTML

Я использую этот код, чтобы найти все интересные ссылки на странице:

2 ответа

Селен - Получить элементы HTML, а не текстовое значение

С помощью этого кода я извлек весь нужный текст из HTML-документа

2 ответа

Этот трюк, кажется, работает и приводит к одной строке кода, но я не уверен, гарантированно ли это работает:

был моей первоначальной идеей в качестве решения, хотя вскоре стало очевидно, что парсер DOM будет более подходящим ... Я хотел бы преобразовать пробелы в&nbsp; между тегами PRE внутри строки текста HTML. Например: <table atrr="zxzx"><tr> ...

3 ответа

Отображать изображения на Android с помощью TextView и Html.ImageGetter асинхронно?

Я хочу установить

3 ответа

удалить теги html-комментариев с помощью регулярных выражений

1 ответ

Я думаю, что это удалит все содержимое тега h2. Я просто хочу заменить имя тега и оставить все остальное без изменений.

ользую python + BeautifulSoup для разбора HTML-документа. Теперь мне нужно заменить все<h2 class="someclass"> элементы в документе HTML, с<h1 class="someclass">. Как я могу изменить имя тега, не меняя ничего в документе?

3 ответа

Извлечение выбранных столбцов из таблицы с помощью BeautifulSoup

Я пытаюсь извлечь первый и третий столбцыэта таблица данных используя BeautifulSoup. Посмотрев на HTML, первый столбец имеет