Resultados da pesquisa a pedido "html-parsing"

5 a resposta

Analisando html com o HTML Agility Pack e o Linq

Eu tenho o seguinte HTML (..) <tbody> <tr> <td class="name"> Test1 </td> <td class="data"> Data </td> <td class="data2"> Data 2 </td> </tr> <tr> <td class="name"> Test2 </td> <td class="data"> Data2 </td> <td class="data2"> Data 2 </td> </tr> ...

1 a resposta

Análise de HTML usando java [duplicado]

Possível duplicado: Possível analisar um documento HTML e criar uma árvore DOM (java) [https://stackoverflow.com/questions/1433250/possible-to-parse-a-html-document-and-build-a-dom-treejava] Oi, Nós usamos para analisar o xml usando DOM, SAX ou ...

2 a resposta

analisador de raspar script do google com 2 classes com o mesmo nome

Eu estou olhando para construir um raspador em scripts do google. Existem 2 classes com o mesmo nome e não consigo encontrar uma maneira de obter a segunda classe. Só produz o primeiro. [/imgs/zdnH7.png] function myFunction() { var url ...

3 a resposta

Analisando Páginas da Web

Eu tenho uma pergunta sobre a análise de páginas HTML, fóruns específicos, desejo analisar um fórum ou segmento que contenha determinados critérios de postagem, ainda não defini o algoritmo, já que analisei apenas os formatos de texto da ...

2 a resposta

Análise de tabela HTML BeautifulSoup

Estou tentando analisar informações (tabelas html) deste site: http://www.511virginia.org/RoadConditions.aspx?j=All&r=1 [http://www.511virginia.org/RoadConditions.aspx?j=All&r=1] Atualmente, estou usando BeautifulSoup e o código que tenho se ...

1 a resposta

HtmlAgility - Salva a análise em uma string

Tentei usar o HtmlAgility Pack pela primeira vez e tive um problema. Primeiro eu carrego de uma variável de string. string NewsText = dr["Message"].ToString(); HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument(); ...

2 a resposta

Como remover tags HTML usando uma lista negra em PHP?

PHPstrip_tags use uma lista de permissões para pular algumas tags que você não deseja que sejam eliminadas. Alguém conhece alguma implementação, mas usa uma lista negra em vez de uma lista branca?

4 a resposta

Perl substituir expressão regular de blocos aninhados

Preciso obter os blocos aninhados na matriz de hash ou na árvore de hash para poder substituir os blocos por conteúdo dinâmico. Preciso substituir o código entre <!--block:XXX-->e o primeiro bloco final de fechamento <!--endblock-->com o meu ...

3 a resposta

Faixa de tags HTML para obter seqüências de caracteres em python

Tentei obter algumas seqüências de caracteres de um arquivo HTML com BeautifulSoup e toda vez que trabalho com ele, obtenho resultados parciais. Eu quero obter as seqüências de caracteres em cada elemento li / tag. Até agora, consegui obter tudo ...

2 a resposta

Análise de entrada de formulário de sopa bonita em Python

Meu objetivo é obter uma lista de todos os nomes e valores de entrada. Para emparelhá-los e enviar o formulário. Os nomes e valores são aleatórios. from bs4 import BeautifulSoup # parsing html = """ <html> <head id="Head1"><title>Title ...