Resultados da pesquisa a pedido "html-parsing"

2 a resposta

juda da sintaxe do python lxml para a análise de html

Sou novato em python e preciso de ajuda com a sintaxe para encontrar e iterar pelas tags html usando lxml. Aqui estão os casos de uso com os quais estou lidando: arquivo @HTML é bastante bem formado (mas não perfeito). Possui várias tabelas na ...

3 a resposta

Parar arquivos HTML como PHP

sta é a maneira correta de analisar arquivos html como ph RemoveHandler .html .htm AddType application/x-httpd-php .php .htm .htmlGuardado em um arquivo .htaccess na minha pasta rai Estou adicionando uma barra de navegação chamada via php e ...

5 a resposta

Melhor maneira de analisar uma tabela HTML em um CSV

Eu tenho que pegar alguns dados do produto de um site existente para colocar em um banco de dados. Os dados estão todos no formato de tabela HTML, os números do modelo são exclusivos, mas cada produto pode ter qualquer número de ...

4 a resposta

Parsing HTML com Python 2.7 - HTMLParser, SGMLParser ou Beautiful Soup?

Eu quero fazer algumas capturas de tela com o Python 2.7 e não tenho contexto para as diferenças entreHTMLParser, SGMLParser, ou sopa bonita. Estão todos tentando resolver o mesmo problema ou existem por diferentes razões? Qual é a mais ...

4 a resposta

HTML Agility pack - analisando tabelas

Eu quero usar o pacote de agilidade HTML para analisar tabelas de páginas da web complexas, mas de alguma forma estou perdido no modelo de objet Eu olhei o exemplo do link, mas não encontrei nenhum dado da tabela dessa maneira. Posso usar o ...

2 a resposta

Converta espaços entre tags PRE, via analisador DOM

Regex foi minha idéia original como solução, embora logo se tornasse aparente que um analisador DOM seria mais apropriado ... Gostaria de converter espaços em&nbsp; entre as tags PRE dentro de uma sequência de texto HTML. Por exemplo <table ...

7 a resposta

Como pesquisar em um arquivo HTML por algumas tags?

Estou tendo um pequeno problema em Java. Como fazer isso: desejo pesquisar em um arquivo HTML as tags href e src e, em seguida, quero obter o URL associado a essas tags. Qual é a melhor maneira de fazer isso? Obrigado pela ajuda. Cumprimentos

2 a resposta

nalisador @DOM: remova apenas determinados atributos

Como posso usar o analisador DOM para removertodo atributos em tags de extensão, masexcet esses dois atributos, <span style="text-decoration: underline;">cultura</span> accept <span style="text-decoration: line-through;">heart</span> accept ...

2 a resposta

XPath pesquisa por tags HTML

O HTML a seguir mostra a terceira pesquisa (pesquisa por "Profissional de diretrizes de prática") não funciona, pois o texto "Diretrizes de prática" é colocado entre o<strong></strong> tag ... É possível realizar a pesquisa XPath para ignorar as ...

5 a resposta

HTML5: W3C vs WHATWG. Qual fornece as especificações mais autoritativas?

Estou no meio do caminho através de um analisador html e encontrei o html5 definidoexplicitament as regras práticas para analisarill formado html. (Eu costumava deduzi-los de DTDs, suspiro) Eu amo esse fato, mas sei bem que o html5 ainda não ...