шаблон регулярного выражения в python для разбора тегов заголовка HTML
Я учусь использовать какre
модуль иurllib
модуль в Python и пытается написать простой веб-скребок. Вот'это код, который яМы написали, чтобы очистить только заголовки сайтов:
#!/usr/bin/python
import urllib
import re
urls=["http://google.com","https://facebook.com","http://reddit.com"]
i=0
these_regex="(.+?)"
pattern=re.compile(these_regex)
while(i