Resultados da pesquisa a pedido "html-parsing"

2 a resposta

Como capturar uma página da IMDb usando BeautifulSoup na Web

Eu sou novo no WebScraping / Python e BeautifulSoup e estou tendo dificuldades em fazer meu código funcionar. Gostaria de raspar o URL:http://m.imdb.com/feature/bornondate [http://m.imdb.com/feature/bornondate]"para obter o: Nome da ...

1 a resposta

Como extrair o texto entre a marca âncora no PHP?

Eu tenho uma string em uma variável intitulada$message do seguinte modo : $message = 'posted an event in <a href="http://52.1.47.143/group/186/">TEST PRA</a>';Quero apenas colocar o texto na tag âncora, ou seja,TESTE PRAneste caso, ...

4 a resposta

Analisador PHP SAX para HTML?

Eu preciso do analisador HTML SAX (não DOM!) Para PHP capaz de processar até mesmo código HTML inválido. A razão pela qual eu preciso é filtrar o HTML inserido pelo usuário (remover todos os atributos e tags, exceto os permitidos) e truncar o ...

29 a resposta

Como você analisa e processa HTML / XML em PHP?

Como alguém pode analisar HTML / XML e extrair informações dele?

2 a resposta

Acessando o html gerado pelo Javascript com htmlunit -Java

Estou tentando testar um site que usa javascript para processar a maior parte do HTML. Com o navegador HTMLUNIT, como você poderia acessar o html gerado pelo javascript? Eu estava olhando a documentação deles, mas não tinha certeza de qual seria ...

1 a resposta

Como os analisadores HTML processam o texto fora dos elementos (nós de texto)

Refira esta pergunta: Adicionar tag html a string no PHP [https://stackoverflow.com/questions/52159323/add-html-tag-to-string-in-php/52162629#comment91289440_52162629] Questionador pergunta como detectar corretamente o texto não marcado em ...

2 a resposta

Exemplo simples de análise de libxml2 HTML, usando Objective-c, Xcode e HTMLparser.h

Alguém pode me mostrar um exemplo simples de analisar algum HTML usando libxml. #import <libxml2/libxml/HTMLparser.h> NSString *html = @"<ul>" "<li><input type=\"image\" name=\"input1\" value=\"string1value\" /></li>" "<li><input type=\"image\" ...

2 a resposta

As tags de faixa do HTML Agility Pack NÃO estão na lista de permissões

Estou tentando criar uma função que remove tags html e atributos que não estão em uma lista branca. Eu tenho o seguinte HTML: <b>first text </b> <b>second text here <a>some text here</a> <a>some text here</a> </b> <a>some twxt here</a>Estou ...

1 a resposta

analisar / extrair uma tabela HTML, site em Java

Eu quero analisar o conteúdo desta tabela HTML: Aqui está o site completo com o código ...

5 a resposta

obter conteúdo das tags <a> usando python

Supondo que eu tenha lido html no meu programa assim: <p><a href="http://vancouver.en.craigslist.ca/nvn/ret/1817849271.html">F/T &amp; P/T Sales Associate - Caliente Fashions</a> - <font size="-1"> (North Vancouver)</font></p> ...