Analisando uma tag de script com dicts no BeautifulSoup
Trabalhando em uma resposta parcial paraesta pergunta, me deparei com umbs4.element.Tag
isso é uma bagunça de dict e listas aninhados (s
, abaixo).
Existe uma maneira de retornar uma lista de URLs contidos ems
sem usandore.find_all
? Outros comentários sobre a estrutura dessa tag também são úteis.
from bs4 import BeautifulSoup
import requests
link = 'https://stackoverflow.com/jobs?med=site-ui&ref=jobs-tab&sort=p'
r = requests.get(link)
soup = BeautifulSoup(r.text, 'html.parser')
s = soup.find('script', type='application/ld+json')
## the first bit of s:
# s
# Out[116]:
# <script type="application/ld+json">
# {"@context":"http://schema.org","@type":"ItemList","numberOfItems":50,
O que eu tentei:
lendo aleatoriamente através de métodos com o preenchimento de guias ems
.escolhendo através dodocs.Meu problema é ques
possui apenas 1 atributo (type
) e parece não ter tags filho.