Resultados da pesquisa a pedido "html-parsing"
DOMDocument do PHP, localizando elementos específicos
Estou procurando encontrar um atributo específico de um elemento específico em um documento HTML usando PHP DOMDocument. Especificamente, há uma div com um conjunto de classes exclusivo e apenas uma única extensão dentro dela. Preciso recuperar ...
Pegar metatags e comentários usando o HTML Agility Pack
Procurei tutoriais sobre o uso do HTML Agility Pack, pois ele parece fazer tudo o que quero, mas parece que, para uma ferramenta tão poderosa, há pouco ruído na Internet. Estou escrevendo um método simples que recuperará qualquer marca com base ...
crie um dicionário ou lista a partir de uma string (tag HTML incluída) em C #
A tem uma string como esta: string s = @" <tr> <td>11</td><td>12</td> </tr> <tr> <td>21</td><td>22</td> </tr> <tr> <td>31</td><td>32</td> </tr>";Como criarDictionary<int, int> d = new Dictionary<int, int>(); da stringspara obter o mesmo ...
Como as análises de HTML funcionam se não estão usando o regexp?
Vejo perguntas todos os dias perguntando como analisar ou extrair algo de uma string HTML e a primeira resposta / comentário é sempre "Não use o RegEx para analisar HTML, para que não sinta a ira!" (essa última parte às vezes é omitida). Isso é ...
Pacote de agilidade HTML
Eu quero analisar a tabela html usando o pacote de agilidade html. Quero extrair apenas alguns dados da coluna predefinidos da tabela. Mas eu sou novo no pacote de análise e agilidade html e tentei, mas não sei como usar o pacote de agilidade ...
Analisando JS com Sopa Bonita
Tenho uma página analisada com uma bela sopa. Mas lá tenho o código js: <script type="text/javascript"> var utag_data = { customer_id : "_PHL2883198554", customer_type : "New", loyalty_id : "N", declined_loyalty_interstitial : "false", ...
Como analisar código html simples com jsoup? andróide
Esta é a parte do meu código html <div class="entry themeform"> <h3>dr James – opiekun naukowy</h3> <p><a href="http://www.page.com/picture.jpg"><img class="alignnone size-medium wp-image-31" alt="grynia" ...
Qual é o melhor pacote arrumado de HTML? Existe alguma opção no pacote de agilidade HTML para tornar a página da Web em HTML organizada?
estou usandopacote de agilidade htmlanalisar htmlinformação tabular. Agora, existe algum conteúdo html com tags finais ausentes e dessa página, devido à falta de tags finais, o pacote de agilidade html não analisa as informações corretamente.tags ...
Como extrair string seguindo um padrão com grep, regex ou perl
Eu tenho um arquivo que se parece com isso: <table name="content_analyzer" primary-key="id"> <type="global" /> </table> <table name="content_analyzer2" primary-key="id"> <type="global" /> </table> <table name="content_analyzer_items" ...
Como obter HTML de um belo objeto de sopa
Eu tenho a seguinte lista de objetos bs4: >>> listing <div class="listingHeader"> <h2> .... >>> type(listing) <class 'bs4.element.Tag'>Eu quero extrair o html bruto como uma string. Eu tentei: >>> a = listing.contents >>> type(a) <type ...