Dodaj znaczniki nadrzędne z piękną zupą
Mam wiele stron HTML z różnymi sekcjami zawierającymi te fragmenty kodu:
<code><div class="footnote" id="footnote-1"> <h3>Reference:</h3> <table cellpadding="0" cellspacing="0" class="floater" style="margin-bottom:0;" width="100%"> <tr> <td valign="top" width="20px"> <a href="javascript:void(0);" onclick='javascript:toggleFootnote("footnote-1");' title="click to hide this reference">1.</a> </td> <td> <p> blah </p> </td> </tr> </table> </div> </code>
Mogę pomyślnie przeanalizować kod HTML i wyodrębnić odpowiednie znaczniki
<code>tags = soup.find_all(attrs={"footnote"}) </code>
Teraz muszę dodać nowe tagi nadrzędne o takich tagach, że fragment kodu idzie:
<code><div class="footnote-out"><CODE></div> </code>
Ale nie mogę znaleźć sposobu na dodawanie znaczników rodzicielskich w bs4, tak że tworzą one określone znaczniki. insert () / insert_before add in po zidentyfikowanych tagach.
Zacząłem od wypróbowania manupulacji:
<code>for tags in soup.find_all(attrs={"footnote"}): tags = BeautifulSoup("""<div class="footnote-out">"""+str(tags)+("</div>")) </code>
ale wierzę, że to nie jest najlepszy kurs.
Dzięki za pomoc. Właśnie zacząłem używać bs / bs4, ale nie wydaje mi się, żeby to złamało.