Получение значения атрибута с помощью BeautifulSoup

Question

Sep 11, 2013, 07:03 AM

Получение значения атрибута с помощью BeautifulSoup

Я пишу скрипт на Python, который будет извлекать местоположения скрипта после анализа с веб-страницы. Допустим, есть два сценария:

<script type="text/javascript" src="http://example.com/something.js"></script>

а также

<script>some JS</script>

Я могу получить JS из второго сценария, то есть когда JS записывается в тегах.

Но есть ли способ, которым я мог бы получить значение src из первого сценария (т.е. извлекать все значения тегов src в сценарии, такие какhttp://example.com/something.js)

Вот мой код

#!/usr/bin/python

import requests 
from bs4 import BeautifulSoup

r  = requests.get("http://rediff.com/")
data = r.text
soup = BeautifulSoup(data)
for n in soup.find_all('script'):
    print n

Выход : Некоторые JS

Требуется выход : http://example.com/something.js

Получение значения атрибута с помощью BeautifulSoup

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Получение значения атрибута с помощью BeautifulSoup

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы