Wyniki wyszukiwania dla "lxml"

1 odpowiedź

Parsing Source Code (Python) Podejście: piękna zupa, lxml, różnica html5lib?

Mam duży kod źródłowy HTML, który chciałbym przeanalizować (~ 200 000) wierszy, i jestem całkiem pewien, że jest trochę słabego formatowania. Badałem parsery...

1 odpowiedź

Używanie python lxml.etree do ogromnych plików XML

Chciałbym przeanalizować ogromny xml (> 200MB) używając

1 odpowiedź

Python lxml - pobierz indeks tekstu tagu

1 odpowiedź

Zmiana domyślnego wcięcia etree.tostring w lxml

Mam dokument XML, który ładnie drukuję za pomocą

1 odpowiedź

Parsowanie CDATA w xml z python

Muszę przeanalizować plik XML z wieloma blokami CDATA, które muszę zachować do późniejszego wydruku:

1 odpowiedź

Czy istnieje sposób na odzyskanie iterparse w przypadku nieprawidłowych wartości Char?

Używam lxml

1 odpowiedź

Python XML Usuń niektóre elementy i ich dzieci, ale zachowaj określone elementy i ich dzieci

Mam bardzo duży plik .xml i próbuję utworzyć nowy plik .xml, który ma tylko niewielką część zawartości tego większego pliku. Chcę określić atrybut (w moim pr...

1 odpowiedź

Czy sekcje CDATA mogą być zachowane przez BeautifulSoup?

Używam BeautifulSoup do odczytu, modyfikacji i zapisu pliku XML. Mam problem z usuwaniem sekcji CDATA. Oto uproszczony przykład.Plik XML sprawcy:

1 odpowiedź

parsuj fragment treści HTML w lxml

Próbuję przeanalizować fragment html:

1 odpowiedź

Wyodrębnianie XML do ramki danych z atrybutem rodzica jako tytuł kolumny