Suchergebnisse für Anfrage "html-parsing"

4 die antwort

Regularer Ausdruck, um alle "src" -Attribute des Ordners "img" nur für HTML-Elemente in PHP zu finden

Ich habe eine Zeichenfolge, in der ich ein Bild habe: "<img src="img/programacao/51.jpg" style="width:200px;" /><p>balbalba</p><img src="img/programacao/46.jpg" style="width:200px;" ...

10 die antwort

Wie erhalte ich den Titel einer Webseite mit dem HTML-Parser?

Wie kann ich mithilfe eines HTML-Parsers den Titel einer Webseite für eine bestimmte URL abrufen? Ist es möglich, den Titel mit regulären Ausdrücken zu erhalten? Ich würde lieber einen HTML-Parser verwenden. Ich arbeite in der Java Eclipse ...

8 die antwort

Wie kann ich die Python-HTMLParser-Bibliothek verwenden, um Daten aus einem bestimmten div-Tag zu extrahieren?

Ich versuche, mithilfe der Python-HTMLParser-Bibliothek einen Wert aus einer HTML-Seite zu ermitteln. Der Wert, den ich erhalten möchte, befindet sich in diesem HTML-Element: ... <div id="remository">20</div> ...Dies ist meine ...

TOP-Veröffentlichungen

6 die antwort

wie man Zellen einer Tabelle mit einfachem html dom druckt

Ich habe diesen HTML-Code. Ich verwende Simple HTML Dom, um die Daten in mein eigenes PHP-Skript zu analysieren. <table> <tr> <td class="header">Name</td> <td class="header">City</td> </tr> <tr> <td class="text">Greg House</td> <td ...

4 die antwort

Bulletproofing SimpleXMLElement

Jeder weiß, dass wir immer DOM-Techniken anstelle von regulären Ausdrücken verwenden sollten, um Inhalte aus HTML zu extrahieren, aber ich habe das Gefühl, dass ich der SimpleXML-Erweiterung oder ähnlichen Erweiterungen niemals vertrauen kann. ...

4 die antwort

PhotoSwipe: Bearbeiten der Funktion parseThumbnailElements zum Parsen des zusätzlichen Markup-Elements

Mit PhotoSwipe sieht das Markup der Thumbnail-Galerie folgendermaßen aus: <div class="wrap clearfix"> <div class="my-gallery" itemscope itemtype="http://schema.org/ImageGallery"> <ul class="gallery-grid"> <li> <figure itemprop="associatedMedia" ...

2 die antwort

Schneller und effektiver Weg, um kaputtes HTML zu analysieren?

Ich arbeite an großen Projekten, die ein schnelles HTML-Parsing erfordern, einschließlich der Wiederherstellung nach kaputten HTML-Seiten. erzeit ist lxml meine Wahl. Ich weiß, dass es eine Schnittstelle für den Wiederherstellungsmodus von ...

14 die antwort

Wie kann eine HTML-Zeichenfolge in Google Apps Script ohne Verwendung von XmlService analysiert werden?

Ich möchte einen Scraper mit Google Spreadsheets und Google Apps Script erstellen. Ich weiß, dass es möglich ist und ich habe einige Tutorials und Threads darüber gesehen. Die Hauptidee ist zu verwenden: var html ...

4 die antwort

Deaktiviere spezielle "Klassen" -Attributbehandlung

Die Geschichte Wenn Sie HTML mit @ analysierBeautifulSoup, class -Attribut wird als @ betracht mehrwertiges Attribut [http://www.crummy.com/software/BeautifulSoup/bs4/doc/#searching-by-css-class] und wird auf besondere Weise behandelt: ...

4 die antwort

Konzentrieren Sie sich auf bestimmte Ergebnisse, während Sie Twitter mit Python und Beautiful Soup 4 bearbeiten?

Dies ist ein Follow-up zu meinem BeitragVerwenden Sie Python, um verschachtelte Divs und Spans in Twitter zu entfernen? [https://stackoverflow.com/questions/34912889/using-python-to-scrape-nested-divs-and-spans-in-twitter] . Ich verwende die ...