Suchergebnisse für Anfrage "html-parsing"

2 die antwort

Java parst HTML-Elemente, die von JS @ generiert wurd

Ich bin sehr neu in der HTML-Analyse mit Java. Früher habe ich JSoup verwendet, um einfaches HTML zu analysieren, ohne es dynamisch zu ändern. Jetzt muss ich jedoch eine Webseite analysieren, die dynamische Elemente enthält. Dies ist der Code, ...

4 die antwort

Mit dem Jsoup HTML Parser Java kann ich nichts erreichen

Ich kann mit Jsoup Java Library keinen Text für die folgenden Szenarien analysieren. 1:This is <b>My Text</b> some other <b> </b> text as well <b></b><b>non empty tag1</b> other text. Erwartete Ausgabe some other <b> </b> text as well ...

2 die antwort

beautifulsoup: find_all on bs4.element.ResultSet Objekt oder Liste?

Hi also bewerbe ich mich find_all auf einembeautifulsoup object, und etwas finden, das ein @ ibs4.element.ResultSet object oder einlist. Ich möchte dort weiter find_all machen, aber es ist auf einem @ nicht erlaubs4.element.ResultSet object. Ich ...

TOP-Veröffentlichungen

4 die antwort

Wie kann ich mit iText HTML mit Bildern und Hyperlinks in PDF konvertieren?

Ich versuche zu konvertierenHTML zuPDF mit iTextSharp in einemASP.NET Webanwendung, die beide @ verwend MVC [http://www.asp.net/mvc], un web forms [http://www.asp.net/web-forms]. Das<img> und<a> Elemente haben absolute und relati URLs und einige ...

4 die antwort

Konzentrieren Sie sich auf bestimmte Ergebnisse, während Sie Twitter mit Python und Beautiful Soup 4 bearbeiten?

Dies ist ein Follow-up zu meinem BeitragVerwenden Sie Python, um verschachtelte Divs und Spans in Twitter zu entfernen? [https://stackoverflow.com/questions/34912889/using-python-to-scrape-nested-divs-and-spans-in-twitter] . Ich verwende die ...

4 die antwort

Deaktiviere spezielle "Klassen" -Attributbehandlung

Die Geschichte Wenn Sie HTML mit @ analysierBeautifulSoup, class -Attribut wird als @ betracht mehrwertiges Attribut [http://www.crummy.com/software/BeautifulSoup/bs4/doc/#searching-by-css-class] und wird auf besondere Weise behandelt: ...

14 die antwort

Wie kann eine HTML-Zeichenfolge in Google Apps Script ohne Verwendung von XmlService analysiert werden?

Ich möchte einen Scraper mit Google Spreadsheets und Google Apps Script erstellen. Ich weiß, dass es möglich ist und ich habe einige Tutorials und Threads darüber gesehen. Die Hauptidee ist zu verwenden: var html ...

2 die antwort

Schneller und effektiver Weg, um kaputtes HTML zu analysieren?

Ich arbeite an großen Projekten, die ein schnelles HTML-Parsing erfordern, einschließlich der Wiederherstellung nach kaputten HTML-Seiten. erzeit ist lxml meine Wahl. Ich weiß, dass es eine Schnittstelle für den Wiederherstellungsmodus von ...

4 die antwort

PhotoSwipe: Bearbeiten der Funktion parseThumbnailElements zum Parsen des zusätzlichen Markup-Elements

Mit PhotoSwipe sieht das Markup der Thumbnail-Galerie folgendermaßen aus: <div class="wrap clearfix"> <div class="my-gallery" itemscope itemtype="http://schema.org/ImageGallery"> <ul class="gallery-grid"> <li> <figure itemprop="associatedMedia" ...

4 die antwort

Regularer Ausdruck, um alle "src" -Attribute des Ordners "img" nur für HTML-Elemente in PHP zu finden

Ich habe eine Zeichenfolge, in der ich ein Bild habe: "<img src="img/programacao/51.jpg" style="width:200px;" /><p>balbalba</p><img src="img/programacao/46.jpg" style="width:200px;" ...