Результаты поиска по запросу "html-content-extraction"

2 ответа

Создать отличный парсер - извлекать соответствующий текст из HTML / блогов

Я пытаюсь создать обобщенный анализатор HTML, который хорошо работает с сообщениями в блогах. Я хочу указать моему анализатору на URL конкретной записи и пол...

8 ответов

Извлечь часть соответствия регулярному выражению

4 ответа

Какие алгоритмы я могу использовать для идентификации контента на веб-странице

У меня есть веб-страница, загруженная в браузер (т.е. ее DOM и расположение элементов оба доступны для меня), и я хочу найти элемент block (или отсортированный список этих элементов), который, вероятно, содержит большую часть контента (как в ...

ТОП публикаций

7 ответов

Python HTML соскоб

Это не очень удобно, я просто пытаюсь найти URL на веб-странице, где у класса есть определенное значение. Например: <a class="myClass" href="/url/7df028f508c4685ddf65987a0bd6f22e">Я хочу получить значение href. Есть идеи, как это сделать? Может ...

2 ответа

BeautifulSoup - простой способ получения содержимого без HTML

Я использую этот код, чтобы найти все интересные ссылки на странице:

5 ответов

Возможность разбора HTML-документа и построения дерева DOM (Java)

Возможно ли это и какие инструменты можно использовать для анализа html-документа в виде строки или из файла, а затем для построения дерева DOM, чтобы разработчик мог пройти по дереву через некоторый API. Например: DomRoot = ...

3 ответа

Извлечение чистого содержимого / текста из HTML-страниц за исключением навигации и содержимого Chrome

8 ответов

Извлечь часть соответствия регулярному выражению

Я хочу, чтобы регулярное выражение для извлечения заголовка из HTML-страницы. В настоящее время у меня есть это: title = re.search('<title>.*</title>', html, re.IGNORECASE).group() if title: title = title.replace('<title>', ...

12 ответов

регулярное выражение для извлечения текста из HTML

Я хотел бы извлечь из общей HTML-страницы весь текст (отображается или нет). я бы хотелУдалить любые теги HTMLЛюбой JavaScriptЛюбые стили CSSЕсть ли регулярное выражение (одно или несколько), которое достигнет этого?

2 ответа

Как разобрать HTML с C ++ / Qt?

Как я могу разобрать следующий HTML