Спасибо за все отклики.

Question

Mar 22, 2009, 06:22 PM

Спасибо за все отклики.

даю приложение на python, и мне нужно получить URL всех ссылок на одной веб-странице. У меня уже есть функция, которая использует urllib для загрузки html-файла из Интернета и преобразования его в список строк с помощью readlines ().

В настоящее время у меня есть этот код, который использует регулярные выражения (я не очень хорош в этом) для поиска ссылок в каждой строке:

for line in lines:
    result = re.match ('/href="(.*)"/iU', line)
    print result

Это не работает, так как выводит «None» только для каждой строки в файле, но я уверен, что по крайней мере есть 3 ссылки на файл, который я открываю.

Может ли кто-нибудь дать мне подсказку на это?

заранее спасибо

Комментировать

Спасибо за все отклики.

Ответы на вопрос(7)

Ваш ответ на вопрос

Популярные вопросы