Resultados da pesquisa a pedido "html-parsing"
juda da sintaxe do python lxml para a análise de html
Sou novato em python e preciso de ajuda com a sintaxe para encontrar e iterar pelas tags html usando lxml. Aqui estão os casos de uso com os quais estou lidando: arquivo @HTML é bastante bem formado (mas não perfeito). Possui várias tabelas na ...
Parar arquivos HTML como PHP
sta é a maneira correta de analisar arquivos html como ph RemoveHandler .html .htm AddType application/x-httpd-php .php .htm .htmlGuardado em um arquivo .htaccess na minha pasta rai Estou adicionando uma barra de navegação chamada via php e ...
Melhor maneira de analisar uma tabela HTML em um CSV
Eu tenho que pegar alguns dados do produto de um site existente para colocar em um banco de dados. Os dados estão todos no formato de tabela HTML, os números do modelo são exclusivos, mas cada produto pode ter qualquer número de ...
Parsing HTML com Python 2.7 - HTMLParser, SGMLParser ou Beautiful Soup?
Eu quero fazer algumas capturas de tela com o Python 2.7 e não tenho contexto para as diferenças entreHTMLParser, SGMLParser, ou sopa bonita. Estão todos tentando resolver o mesmo problema ou existem por diferentes razões? Qual é a mais ...
HTML Agility pack - analisando tabelas
Eu quero usar o pacote de agilidade HTML para analisar tabelas de páginas da web complexas, mas de alguma forma estou perdido no modelo de objet Eu olhei o exemplo do link, mas não encontrei nenhum dado da tabela dessa maneira. Posso usar o ...
Converta espaços entre tags PRE, via analisador DOM
Regex foi minha idéia original como solução, embora logo se tornasse aparente que um analisador DOM seria mais apropriado ... Gostaria de converter espaços em entre as tags PRE dentro de uma sequência de texto HTML. Por exemplo <table ...
Como pesquisar em um arquivo HTML por algumas tags?
Estou tendo um pequeno problema em Java. Como fazer isso: desejo pesquisar em um arquivo HTML as tags href e src e, em seguida, quero obter o URL associado a essas tags. Qual é a melhor maneira de fazer isso? Obrigado pela ajuda. Cumprimentos
nalisador @DOM: remova apenas determinados atributos
Como posso usar o analisador DOM para removertodo atributos em tags de extensão, masexcet esses dois atributos, <span style="text-decoration: underline;">cultura</span> accept <span style="text-decoration: line-through;">heart</span> accept ...
XPath pesquisa por tags HTML
O HTML a seguir mostra a terceira pesquisa (pesquisa por "Profissional de diretrizes de prática") não funciona, pois o texto "Diretrizes de prática" é colocado entre o<strong></strong> tag ... É possível realizar a pesquisa XPath para ignorar as ...
HTML5: W3C vs WHATWG. Qual fornece as especificações mais autoritativas?
Estou no meio do caminho através de um analisador html e encontrei o html5 definidoexplicitament as regras práticas para analisarill formado html. (Eu costumava deduzi-los de DTDs, suspiro) Eu amo esse fato, mas sei bem que o html5 ainda não ...