Спасибо за все отклики.
даю приложение на python, и мне нужно получить URL всех ссылок на одной веб-странице. У меня уже есть функция, которая использует urllib для загрузки html-файла из Интернета и преобразования его в список строк с помощью readlines ().
В настоящее время у меня есть этот код, который использует регулярные выражения (я не очень хорош в этом) для поиска ссылок в каждой строке:
for line in lines:
result = re.match ('/href="(.*)"/iU', line)
print result
Это не работает, так как выводит «None» только для каждой строки в файле, но я уверен, что по крайней мере есть 3 ссылки на файл, который я открываю.
Может ли кто-нибудь дать мне подсказку на это?
заранее спасибо