Результаты поиска по запросу "html-parsing"
Парсинг веб-страниц
У меня есть вопрос о разборе HTML-страниц, особенно форумов, я хочу проанализировать форум или тему, содержащую определенные критерии публикации, я еще не определил алгоритм, так как раньше я только анализировал текстовые форматы структуры, ...
Простой HTML-файл file_get_html не работает - есть ли обходной путь?
<?php // Report all PHP errors (see changelog) error_reporting(E_ALL); include('inc/simple_html_dom.php'); //base url $base = 'https://play.google.com/store/apps'; //home page HTML $html_base = file_get_html( $base ); //get all category links ...
У меня есть другая проблема, что я хочу только имя файла, но вывод дал мне путь + имя файла. Я только что обновил код.
адача - прочитать каждый HTML-файл из каталога. Условия, чтобы найти, содержит ли каждый файл теги
https://github.com/phax/ph-css
жно беспокоиться о связанном стиле или стиле наведения. Я хочу автоматически конвертировать файлы, как это <html> <body> <style> body{background:#FFC} p{background:red} body, p{font-weight:bold} </style> <p>...</p> </body> </html>к таким ...
П.С., у меня версия 1.4.0.0 HtmlAgilityPack и .NET 3.5
ужно разобрать HTML-код. Точнее, проанализируйте каждую ячейку каждой строки во всех таблицах. Каждая строка представляет отдельный объект, а каждая ячейка представляет разные свойства. Я хочу проанализировать их, чтобы иметь возможность писать ...
http://htmlparser.sourceforge.net/
ужно получить значение («abc» в примере ниже) из файла HTML, который выглядит следующим образом: <input type="hidden" name="something" value="abc" />Как я узнал из других постов, я должен использовать один из парсеров HTML (не регулярное ...
Можете ли вы опубликовать весь свой код? Я не могу понять, что говорит твоя ошибка, не видя всего этого
, чтобы построить скребок в скриптах Google. Есть 2 класса с одинаковым именем, и я не могу найти способ получить второй класс. Выводит только первый. [/imgs/zdnH7.png] function myFunction() { var url ...
), который хотя и не поддерживается в CodePlex (это был намек, Кит), дает разумный рабочий набор функций для трамплина.
я есть следующий HTML (..) <tbody> <tr> <td class="name"> Test1 </td> <td class="data"> Data </td> <td class="data2"> Data 2 </td> </tr> <tr> <td class="name"> Test2 </td> <td class="data"> Data2 </td> <td class="data2"> Data 2 </td> </tr> ...
http://htmlcleaner.sourceforge.net/
жный дубликат: Возможность разбора HTML-документа и построения дерева DOM (Java) [https://stackoverflow.com/questions/1433250/possible-to-parse-a-html-document-and-build-a-dom-treejava] Привет! Мы используем для анализа XML, используя DOM, SAX ...
не берите в голову второй вопрос, я использую другой счетчик
я есть правила синтаксического анализа, которые возвращают true, но он не вставляет мой текст, как ожидалось: html не изменился, тогда как он должен был быть вставлен в конце основного заключительного div. Я пытался использовать счетчик, какКак ...