, Отсюда простой доступ к словарю:
а над частичным ответом наэтот вопрос, я наткнулся наbs4.element.Tag
это беспорядок вложенных диктов и списков (s
ниже).
Есть ли способ вернуть список URL-адресов, содержащихся вs
без с помощьюre.find_all
? Другие комментарии, касающиеся структуры этого тега, также полезны.
from bs4 import BeautifulSoup
import requests
link = 'https://stackoverflow.com/jobs?med=site-ui&ref=jobs-tab&sort=p'
r = requests.get(link)
soup = BeautifulSoup(r.text, 'html.parser')
s = soup.find('script', type='application/ld+json')
## the first bit of s:
# s
# Out[116]:
# <script type="application/ld+json">
# {"@context":"http://schema.org","@type":"ItemList","numberOfItems":50,
Что я пробовал:
случайно просматривает методы с завершением табуляции наs
.выбирая черездокументы.Моя проблема в том чтоs
имеет только 1 атрибут (type
) и, похоже, не имеет дочерних тегов.