Результаты поиска по запросу "html-agility-pack"

1 ответ

Html-Agility-Pack не загружает страницу с полным содержимым?

я использую Html Agility Pack для извлечения данных с веб-сайта (утилизация) Моя проблема заключается в том, что веб-сайт, из которого я получаю данные, загружает часть содержимого после нескольких секунд загрузки страницы. ТАК КАК всякий раз, ...

3 ответа

Извините, я думаю, мои примеры HTML были слишком упрощенными. Нужно скопировать больше, чем InnerText, в родительский элемент. Пожалуйста, смотрите мои исправленные / отредактированные примеры.

аюсь заменить эту ужасную коллекцию регулярных выражений, которая в настоящее время используется для очистки блоков плохо сформированного HTML и наткнулась на пакет Agility HTML для C #. Это выглядит очень мощно, но пока я не смог найти пример ...

4 ответа

 чтобы получить правильную строку HTML.

даю HTML-документ, используя пакет agility HTML. Я загружаю файл шаблона и добавляю к нему содержимое. Все это работает, но когда я просматриваю выходной файл, он удаляет закрывающий тег из моего<br/> теги, чтобы выглядеть так<br>, Чем это ...

ТОП публикаций

2 ответа

 должно быть

тносится к файлам cookie, установленным внутри скрипта (возможно, внутри тега скрипта). System.Windows.Forms.HtmlDocument выполняет эти сценарии и набор файлов cookie (например,document.cookie=etc...) можно получить через егоПеченье свойство. Я ...

1 ответ

+1, так как я не понял вопроса и не ответил правильно и удалил свой ответ.

ользую следующее, чтобы получить веб-страницу, которая работает нормально public static HtmlDocument GetWebPageFromUrl(string url) { var hw = new HtmlWeb(); return hw.Load(url); }Но как мне выложить все содержимое HTML из HtmlDocument в ...

1 ответ

Саймон, спасибо за разъяснения, должен сказать, что это отличная библиотека - отличная работа :)

ьзуюсь HTML Agility Pack, и это меня очень впечатлило. doc.DocumentNode.SelectSingleNode("//body").InnerHtmlКак мне разобраться со следующей ситуацией, с разными документами? <body> <Body> <BODY>Будет ли мой код выше получать только строчные ...

1 ответ

Мне нравится идея этого решения, но я использую Enumerable.Empty вместо ToList. Таким образом, вы не будете повторять преобразование в список.

я проблемы с пакетом HTML Agility. Я получаю исключение нулевой ссылки, когда использую этот метод в HTML, не содержащем конкретный узел. Сначала это работало, но потом перестало работать. Это всего лишь фрагмент, и есть еще около 10 циклов ...

4 ответа

 который предоставляет способ автоматического отступа:

я генерирую HTML с использованием HtmlAgilityPack, и он работает отлично, но текст HTML не отступ. Однако я могу получить XML с отступом, но мне нужен HTML. Есть ли способ? HtmlDocument doc = new HtmlDocument(); // gen html HtmlNode table ...

1 ответ

@ boilers222: Вы не можете получить доступ к файловой системе другого компьютера. Вам необходимо отправить HTTP-запрос на некоторый серверный код, который напишет файл для вас.

ользую свой локальный сервер Apache, и его адрес 127.0.0.1. и я пытаюсь загрузить HTML-страницу с этого сервера в C # программу с использованием HTML Agility PACk, но его показ ОШИБКА: формат данного пути не ...

1 ответ

Работает на меня, не знаю, о чем ты говоришь.

у использовать пакет гибкости HTML для анализа таблиц со сложных веб-страниц, но я как-то теряюсь в объектной модели. Я посмотрел на пример ссылки, но не нашел никаких табличных данных таким образом. Могу ли я использовать XPath для получения ...