Результаты поиска по запросу "html-parsing"

1 ответ

Импорт bs4 в Python 3.5

Я установил Python 3.5 и Beautifulsoup4. Когда я пытаюсь импортировать bs4, я получаю сообщение об ошибке ниже. Есть ли какое-то решение для этого? Или я дол...

3 ответа

Хорошо, спасибо всем. Я не заметил 301, но теперь я исправил

аюсь прочитать HTML-код из URL-соединения. В одном случае html-файл, который я пытаюсь прочитать, содержит 5 разрывов строк перед фактическим объявлением типа документа. В этом случае читатель ввода выдает исключение для EOF. URL pageUrl = new ...

4 ответа

Как получить весь текст между двумя указанными тегами, используя BeautifulSoup?

ТОП публикаций

2 ответа

http://www.php.net/manual/en/function.strip-tags.php#96483

используйте белый список, чтобы пропустить некоторые теги, которые вы не хотите, чтобы избавиться. Кто-нибудь знает некоторую реализацию, но используя черный список вместо белого?strip_tagsБудет работать простой сложный поиск регулярных выражений ...

1 ответ

Как сохранить обратно изменения, сделанные в файле HTML, используя BeautifulSoup в Python?

У меня есть скрипт ниже, который изменяетhref атрибуты в файле HTML (в будущем это будет список файлов HTML в каталоге). Используя BeautifulSoup мне удалось получить доступ к значениям тегов и изменить их, как я хочу, но я не знаю, как сохранить ...

1 ответ

Html-Agility-Pack не загружает страницу с полным содержимым?

я использую Html Agility Pack для извлечения данных с веб-сайта (утилизация) Моя проблема заключается в том, что веб-сайт, из которого я получаю данные, загружает часть содержимого после нескольких секунд загрузки страницы. ТАК КАК всякий раз, ...

4 ответа

Как работает анализ HTML, если они не используют регулярные выражения?

Каждый день я вижу вопросы о том, как анализировать или извлекать что-либо из какой-либо строки HTML, и первый ответ / комментарий всегда звучит так: «Не исп...

1 ответ

BeautifulSoup не может проанализировать состояние длительного просмотра

Я пытаюсь использовать BeautifulSoup4 для анализа html, полученного изhttp://exporter.nih.gov/ExPORTER_Catalog.aspx?index=0 Если я распечатаю полученный суп,...

1 ответ

Как получить код тега IMG из документа HTML?

5 ответов

Это не стабилизирует их. Он слепо копирует, часто вставляя их с ошибками.

полпути через анализатор HTML и нашел html5 определенэксплицитноправила большого пальца для разбораплохо сформированный HTML. (И я имел обыкновение выводить их из DTD, вздох) Мне нравится этот факт, но я хорошо знаю, что html5 еще не завершен ...