Resultados da pesquisa a pedido "html-parsing"

2 a resposta

DOMDocument do PHP, localizando elementos específicos

Estou procurando encontrar um atributo específico de um elemento específico em um documento HTML usando PHP DOMDocument. Especificamente, há uma div com um conjunto de classes exclusivo e apenas uma única extensão dentro dela. Preciso recuperar ...

1 a resposta

Pegar metatags e comentários usando o HTML Agility Pack

Procurei tutoriais sobre o uso do HTML Agility Pack, pois ele parece fazer tudo o que quero, mas parece que, para uma ferramenta tão poderosa, há pouco ruído na Internet. Estou escrevendo um método simples que recuperará qualquer marca com base ...

6 a resposta

crie um dicionário ou lista a partir de uma string (tag HTML incluída) em C #

A tem uma string como esta: string s = @" <tr> <td>11</td><td>12</td> </tr> <tr> <td>21</td><td>22</td> </tr> <tr> <td>31</td><td>32</td> </tr>";Como criarDictionary<int, int> d = new Dictionary<int, int>(); da stringspara obter o mesmo ...

5 a resposta

Como as análises de HTML funcionam se não estão usando o regexp?

Vejo perguntas todos os dias perguntando como analisar ou extrair algo de uma string HTML e a primeira resposta / comentário é sempre "Não use o RegEx para analisar HTML, para que não sinta a ira!" (essa última parte às vezes é omitida). Isso é ...

1 a resposta

Pacote de agilidade HTML

Eu quero analisar a tabela html usando o pacote de agilidade html. Quero extrair apenas alguns dados da coluna predefinidos da tabela. Mas eu sou novo no pacote de análise e agilidade html e tentei, mas não sei como usar o pacote de agilidade ...

1 a resposta

Analisando JS com Sopa Bonita

Tenho uma página analisada com uma bela sopa. Mas lá tenho o código js: <script type="text/javascript"> var utag_data = { customer_id : "_PHL2883198554", customer_type : "New", loyalty_id : "N", declined_loyalty_interstitial : "false", ...

1 a resposta

Como analisar código html simples com jsoup? andróide

Esta é a parte do meu código html <div class="entry themeform"> <h3>dr James &#8211; opiekun naukowy</h3> <p><a href="http://www.page.com/picture.jpg"><img class="alignnone size-medium wp-image-31" alt="grynia" ...

1 a resposta

Qual é o melhor pacote arrumado de HTML? Existe alguma opção no pacote de agilidade HTML para tornar a página da Web em HTML organizada?

estou usandopacote de agilidade htmlanalisar htmlinformação tabular. Agora, existe algum conteúdo html com tags finais ausentes e dessa página, devido à falta de tags finais, o pacote de agilidade html não analisa as informações corretamente.tags ...

8 a resposta

Como extrair string seguindo um padrão com grep, regex ou perl

Eu tenho um arquivo que se parece com isso: <table name="content_analyzer" primary-key="id"> <type="global" /> </table> <table name="content_analyzer2" primary-key="id"> <type="global" /> </table> <table name="content_analyzer_items" ...

1 a resposta

Como obter HTML de um belo objeto de sopa

Eu tenho a seguinte lista de objetos bs4: >>> listing <div class="listingHeader"> <h2> .... >>> type(listing) <class 'bs4.element.Tag'>Eu quero extrair o html bruto como uma string. Eu tentei: >>> a = listing.contents >>> type(a) <type ...