Aug 25, 2009, 10:24 AM

html-content-extraction python regex html

Извлечь часть соответствия регулярному выражению

Я хочу, чтобы регулярное выражение для извлечения заголовка из HTML-страницы. В настоящее время у меня есть это:

title = re.search('.*', html, re.IGNORECASE).group()
if title:
    title = title.replace('', '').replace('', '')

Есть ли регулярное выражение для извлечения только содержимого <название> так что я ненужно удалить теги?

Ответы на вопрос(8)

Популярные вопросы

0 ответов

Как использовать поле со списком в форме доступа для обновления записи с внешним ключом, но отображать поиск этого ключа?

0 ответов

Angular 2 - Включение провайдера в услугу

0 ответов

Forcing QGraphicsItem, чтобы остаться [дубликат]

0 ответов

Срок действия маркера доступа Twitter истекает?

0 ответов

О MySQL ++, GPL и LGPL [закрыто]