Получение значения атрибута с помощью BeautifulSoup
Я пишу скрипт на Python, который будет извлекать местоположения скрипта после анализа с веб-страницы. Допустим, есть два сценария:
<script type="text/javascript" src="http://example.com/something.js"></script>
а также
<script>some JS</script>
Я могу получить JS из второго сценария, то есть когда JS записывается в тегах.
Но есть ли способ, которым я мог бы получить значение src из первого сценария (т.е. извлекать все значения тегов src в сценарии, такие какhttp://example.com/something.js)
Вот мой код
#!/usr/bin/python
import requests
from bs4 import BeautifulSoup
r = requests.get("http://rediff.com/")
data = r.text
soup = BeautifulSoup(data)
for n in soup.find_all('script'):
print n
Выход : Некоторые JS
Требуется выход : http://example.com/something.js