BeautifulSoup contando tags sem analisar profundamente dentro deles

Question

Dec 28, 2014, 05:14 AM

BeautifulSoup contando tags sem analisar profundamente dentro deles

Eu pensei sobre o seguinteenquanto escrevia uma resposta para esta pergunta.

Suponha que eu tenha um profundo aninhadoxml arquivo como este (mas muito mais aninhado e muito mais longo):

<section name="1">
    <subsection name"foo">
        <subsubsection name="bar">
            <deeper name="hey">
                <much_deeper name"yo">
                    <li>Some content</li>
                </much_deeper>
            </deeper>
        </subsubsection>
    </subsection>
</section>
<section name="2">
    ... and so forth
</section>

O problema comlen(soup.find_all("section")) é que enquanto fazfind_all("section"), O BS continua pesquisando profundamente em uma tag que eu sei que não conterá outrasection etiqueta, rótulo, palavra-chave.

Então, duas perguntas:

Existe uma maneira de fazer BSnão pesquisar recursivamente em uma tag já encontrada?Se a resposta a 1 for sim, será mais eficiente ou será o mesmo processo interno?