Suchergebnisse für Anfrage "html-parsing"

4 die antwort

Wie kann ich mit iText HTML mit Bildern und Hyperlinks in PDF konvertieren?

Ich versuche zu konvertierenHTML zuPDF mit iTextSharp in einemASP.NET Webanwendung, die beide @ verwend MVC [http://www.asp.net/mvc], un web forms [http://www.asp.net/web-forms]. Das<img> und<a> Elemente haben absolute und relati URLs und einige ...

10 die antwort

get Inhalt von <a> -Tags mit python

Angenommen, ich habe HTML in mein Programm wie folgt eingelesen: <p><a href="http://vancouver.en.craigslist.ca/nvn/ret/1817849271.html">F/T &amp; P/T Sales Associate - Caliente Fashions</a> - <font size="-1"> (North Vancouver)</font></p> ...

2 die antwort

So extrahieren Sie dynamischen Ajax-Inhalt von einer Webseite

Meine Anforderung ist es, den erforderlichen Inhalt von einer Webseite zu extrahieren. Die Seite enthält einen Abschnitt, der mit Ajax gefüllt wird. Wenn ich...

TOP-Veröffentlichungen

14 die antwort

Wie kann eine HTML-Zeichenfolge in Google Apps Script ohne Verwendung von XmlService analysiert werden?

Ich möchte einen Scraper mit Google Spreadsheets und Google Apps Script erstellen. Ich weiß, dass es möglich ist und ich habe einige Tutorials und Threads darüber gesehen. Die Hauptidee ist zu verwenden: var html ...

4 die antwort

Richtige HTML-Markup-Syntax? (um Leerzeichen zwischen Inline-Block-Elementen zu entfernen) [duplizieren]

Diese Frage hat hier bereits eine Antwort:Wie entferne ich den Abstand zwischen Inline-Block-Elementen? 37 AntwortenWenn HTML-Code nicht &quot;verschönert&qu...

4 die antwort

Konzentrieren Sie sich auf bestimmte Ergebnisse, während Sie Twitter mit Python und Beautiful Soup 4 bearbeiten?

Dies ist ein Follow-up zu meinem BeitragVerwenden Sie Python, um verschachtelte Divs und Spans in Twitter zu entfernen? [https://stackoverflow.com/questions/34912889/using-python-to-scrape-nested-divs-and-spans-in-twitter] . Ich verwende die ...

4 die antwort

Wie bekomme ich rohes XML von lxml zurück?

Ich benutze den folgenden Code, um einen div zu finden: parser = etree.HTMLParser() tree = etree.parse(StringIO(page), parser) div = tree.xpath("//div[@class='content']")[0] Mein einziges Problem ist, dass ich mich danach nicht auf lxml ...

1 die antwort

So erhalten Sie mit Beautiful Soup mehrere Klassen in einer Abfrage

Ich möchte td mit class = &quot;s&quot; oder class = &quot;sb&quot; im folgenden HTML finden

1 die antwort

Welches ist das beste aufgeräumte HTML-Paket? Gibt es im HTML-Agility-Pack eine Option, mit der HTML-Webseiten aufgeräumt werden können?

ich benutzeHTML-Agility-Packzum Parsen von HTMLtabellarische Informationen. Jetzt gibt es einige HTML-Inhalte mit fehlenden Ending-Tags und von einer solchen Seite, weil die Ending-Tags fehlen. Das HTML-Agility-Pack analysiert die Informationen ...

1 die antwort

PHP DOM: Parsen einer HTML-Liste in ein Array?