Adicione tags pai com uma sopa bonita
Eu tenho muitas páginas de HTML com várias seções contendo esses trechos de código:
<code><div class="footnote" id="footnote-1"> <h3>Reference:</h3> <table cellpadding="0" cellspacing="0" class="floater" style="margin-bottom:0;" width="100%"> <tr> <td valign="top" width="20px"> <a href="javascript:void(0);" onclick='javascript:toggleFootnote("footnote-1");' title="click to hide this reference">1.</a> </td> <td> <p> blah </p> </td> </tr> </table> </div> </code>
Eu posso analisar o HTML com sucesso e extrair essas tags relevantes
<code>tags = soup.find_all(attrs={"footnote"}) </code>
Agora preciso adicionar novas tags pai sobre elas, de modo que o snippet de código seja:
<code><div class="footnote-out"><CODE></div> </code>
Mas eu não consigo encontrar uma maneira de adicionar tags pai em bs4 de tal forma que elas preparem as tags identificadas. insert () / insert_before após inserir as tags identificadas.
Comecei tentando manupulação de string:
<code>for tags in soup.find_all(attrs={"footnote"}): tags = BeautifulSoup("""<div class="footnote-out">"""+str(tags)+("</div>")) </code>
mas acredito que esse não seja o melhor caminho.
Obrigado por qualquer ajuda. Apenas comecei a usar o bs / bs4, mas não consigo quebrar isso.