Suchergebnisse für Anfrage "beautifulsoup"
Wie finde ich alle Kommentare mit Beautiful Soup
Diese Frag [https://stackoverflow.com/questions/6062210/how-to-find-the-comment-tag-with-beautifulsoup] wurde vor vier Jahren gefragt, aber die Antwort ist für BS4 nicht mehr aktuell. Ich möchte alle Kommentare in meiner HTML-Datei mit schöner ...
BeautifulSoup und ASP.NET/C
Hat jemand BeautifulSoup in ASP.NET/C# integriert (möglicherweise mit IronPython oder auf andere Weise)? Gibt es eine BeautifulSoup-Alternative oder einen Port, der gut mit ASP.NET/C#@ zusammenarbeite Die Absicht der Nutzung der Bibliothek ...
BeautifulSoup (html) funktioniert nicht und sagt, Modul kann nicht aufgerufen werden?
import urllib2 import urllib from BeautifulSoup import BeautifulSoup # html from BeautifulSoup import BeautifulStoneSoup # xml import BeautifulSoup # everything import re f = o.open( 'http://www.google.com', p) html = f.read() f.close() soup = ...
Wie BeautifulSoup Benutzer Warnung loswerden?
Nachdem ich BeautifulSoup installiert habe, wird bei jedem Ausführen von Python in cmd diese Warnung angezeigt. D:\Application\python\lib\site-packages\beautifulsoup4-4.4.1-py3.4.egg\bs4\__init__.py:166: UserWarning: No parser was explicitly ...
Wie behalte ich Leerzeichen in BeautifulSoup.contents
Die meisten Beispiele, die ich online finde, zeigen, wie man Leerzeichen entfernt - aber in meinem Fall muss ich es behalten. Ich habe html = "I can flip this whole thing with one hand\n <span>D#m</span>\nThe ringleader man\n<span>A#</span> ...
beautifulsoup, Finde den Preis mit dem Text 'price', dann hole den Preis vom nächsten th
Mein HTML sieht so aus: <td> <table ..> <tr> <th ..>price</th> <th>$99.99</th> </tr> </table> </td>So bin ich in der aktuellen Tabellenzelle, wie würde ich den 99,99-Wert erhalten? Ich habe bisher: td[3].findChild('th')Aber ich muss ...
Schneller und effektiver Weg, um kaputtes HTML zu analysieren?
Ich arbeite an großen Projekten, die ein schnelles HTML-Parsing erfordern, einschließlich der Wiederherstellung nach kaputten HTML-Seiten. erzeit ist lxml meine Wahl. Ich weiß, dass es eine Schnittstelle für den Wiederherstellungsmodus von ...
Repetitive Prozess, um Links auf einer Website zu folgen (BeautifulSoup)
Ich schreibe einen Code in Python, um alle 'a'-Tags in einer URL mit Beautiful soup abzurufen. Dann verwende ich den Link an Position 3. Dann sollte ich diesem Link folgen. Ich werde diesen Vorgang ungefähr 18 Mal wiederholen. Ich habe ...
Deaktiviere spezielle "Klassen" -Attributbehandlung
Die Geschichte Wenn Sie HTML mit @ analysierBeautifulSoup, class -Attribut wird als @ betracht mehrwertiges Attribut [http://www.crummy.com/software/BeautifulSoup/bs4/doc/#searching-by-css-class] und wird auf besondere Weise behandelt: ...
TypeError: Ein byteähnliches Objekt ist erforderlich, nicht 'str' in Python und CSV
TypeError: Ein byteähnliches Objekt ist erforderlich, nicht 'str' getting über Fehler beim Ausführen unter Python-Code zum Speichern der HTML-Tabellendaten in der CSV-Datei. Ich weiß nicht, wie ich mich an rideup.pls gewöhnen kann. import csv ...