Resultados da pesquisa a pedido "html-parsing"
Como capturar uma página da IMDb usando BeautifulSoup na Web
Eu sou novo no WebScraping / Python e BeautifulSoup e estou tendo dificuldades em fazer meu código funcionar. Gostaria de raspar o URL:http://m.imdb.com/feature/bornondate [http://m.imdb.com/feature/bornondate]"para obter o: Nome da ...
Como extrair o texto entre a marca âncora no PHP?
Eu tenho uma string em uma variável intitulada$message do seguinte modo : $message = 'posted an event in <a href="http://52.1.47.143/group/186/">TEST PRA</a>';Quero apenas colocar o texto na tag âncora, ou seja,TESTE PRAneste caso, ...
Analisador PHP SAX para HTML?
Eu preciso do analisador HTML SAX (não DOM!) Para PHP capaz de processar até mesmo código HTML inválido. A razão pela qual eu preciso é filtrar o HTML inserido pelo usuário (remover todos os atributos e tags, exceto os permitidos) e truncar o ...
Como você analisa e processa HTML / XML em PHP?
Como alguém pode analisar HTML / XML e extrair informações dele?
Acessando o html gerado pelo Javascript com htmlunit -Java
Estou tentando testar um site que usa javascript para processar a maior parte do HTML. Com o navegador HTMLUNIT, como você poderia acessar o html gerado pelo javascript? Eu estava olhando a documentação deles, mas não tinha certeza de qual seria ...
Como os analisadores HTML processam o texto fora dos elementos (nós de texto)
Refira esta pergunta: Adicionar tag html a string no PHP [https://stackoverflow.com/questions/52159323/add-html-tag-to-string-in-php/52162629#comment91289440_52162629] Questionador pergunta como detectar corretamente o texto não marcado em ...
Exemplo simples de análise de libxml2 HTML, usando Objective-c, Xcode e HTMLparser.h
Alguém pode me mostrar um exemplo simples de analisar algum HTML usando libxml. #import <libxml2/libxml/HTMLparser.h> NSString *html = @"<ul>" "<li><input type=\"image\" name=\"input1\" value=\"string1value\" /></li>" "<li><input type=\"image\" ...
As tags de faixa do HTML Agility Pack NÃO estão na lista de permissões
Estou tentando criar uma função que remove tags html e atributos que não estão em uma lista branca. Eu tenho o seguinte HTML: <b>first text </b> <b>second text here <a>some text here</a> <a>some text here</a> </b> <a>some twxt here</a>Estou ...
analisar / extrair uma tabela HTML, site em Java
Eu quero analisar o conteúdo desta tabela HTML: Aqui está o site completo com o código ...
obter conteúdo das tags <a> usando python
Supondo que eu tenha lido html no meu programa assim: <p><a href="http://vancouver.en.craigslist.ca/nvn/ret/1817849271.html">F/T & P/T Sales Associate - Caliente Fashions</a> - <font size="-1"> (North Vancouver)</font></p> ...