@JRB Хорошо, я предлагаю вам сначала попробовать это самостоятельно, и если у вас возникли проблемы с его работой, опубликуйте это как вопрос и то, что вы пытались сделать, и мы постараемся вам помочь.

ал, что HTMLAgility 1.4 - отличное решение для очистки веб-страницы. Будучи новым программистом, я надеюсь, что смогу внести свой вклад в этот проект. Я делаю это как форму заявки c #. Страница, с которой я работаю, довольно прямолинейна. Информация, которая мне нужна, застряла между двумя тегами и. Моя цель состоит в том, чтобы вытащить данные для Part-Num, Manu-Number, Description, Manu-Country, Last Modified, Last Modified By со страницы и отправить данные в таблицу sql. Одним из недостатков является то, что есть также небольшая картинка в формате png, которую также нужно получить из номера src = "/ partcode / number.

У меня нет завершенного кода, который работает. Я думал, что этот фрагмент кода скажет мне, если я иду в правильном направлении. Даже входя в отладку, я не вижу, что она что-то делает. Может ли кто-то указать мне правильное направление на это. Чем детальнее, тем лучше, поскольку очевидно, что мне есть чему поучиться. Спасибо, я был бы очень признателен.

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using HtmlAgilityPack;
using System.Xml;

namespace Stats
{
    class PartParser
    {
        static void Main(string[] args)
        {
            HtmlDocument doc = new HtmlDocument();
            doc.LoadHtml("http://localhost");//my understanding this reads the entire page in?
            var tables = doc.DocumentNode.SelectNodes("//table");// I assume that this sets up the search for words containing table

        }
            catch (Exception ex)
            {
                Console.WriteLine(ex.Message);
                Console.WriteLine(ex.StackTrace);
                Console.ReadKey();    
            }
        }
    }
}

Код сети:

<!DOCTYPE html 
     PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
     "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
<head>
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8" />
<title>Part Number Database: Item Record</title>
<table class="data">
<tr><td>Part-Num</td><td width="50"></td><td><img src="/partcode/number/072140" alt="072140"/></td></tr>
<tr><td>Manu-Number</td><td width="50"></td><td><img src="/partcode/manu/00721408" alt="00721408" /></td></tr>    
<tr><td>Description</td><td></td><td>Widget 3.5</td></tr>
<tr><td>Manu-Country</td><td></td><td>United States</td></tr>    
<tr><td>Last Modified</td><td></td><td>26 Jan 2009,  8:08 PM</td></tr>    
<tr><td>Last Modified By</td><td></td><td>Manu</td></tr>
</table>
<p>
</body>
</html>

Ответы на вопрос(0)

Ваш ответ на вопрос