BeautifulSoup contando tags sem analisar profundamente dentro deles
Eu pensei sobre o seguinteenquanto escrevia uma resposta para esta pergunta.
Suponha que eu tenha um profundo aninhadoxml
arquivo como este (mas muito mais aninhado e muito mais longo):
<section name="1">
<subsection name"foo">
<subsubsection name="bar">
<deeper name="hey">
<much_deeper name"yo">
<li>Some content</li>
</much_deeper>
</deeper>
</subsubsection>
</subsection>
</section>
<section name="2">
... and so forth
</section>
O problema comlen(soup.find_all("section"))
é que enquanto fazfind_all("section")
, O BS continua pesquisando profundamente em uma tag que eu sei que não conterá outrasection
etiqueta, rótulo, palavra-chave.
Então, duas perguntas:
Existe uma maneira de fazer BSnão pesquisar recursivamente em uma tag já encontrada?Se a resposta a 1 for sim, será mais eficiente ou será o mesmo processo interno?