Resultados da pesquisa a pedido "html-parsing"
Focar em resultados específicos enquanto raspa o Twitter com Python e Beautiful Soup 4?
Este é um acompanhamento do meu postUsando Python para raspar divs e extensões aninhadas no Twitter? [https://stackoverflow.com/questions/34912889/using-python-to-scrape-nested-divs-and-spans-in-twitter] . Não estou usando a API do Twitter, ...
Como uso a libcurl para fazer login em um site seguro e obter o html por trás do login
Ei pessoal, eu queria saber se vocês poderiam me ajudar a acessar o html atrás de uma página de login usando C e libcurl. Exemplo Específico: O site que estou tentando acessar ...
Como posso usar o iText para converter HTML com imagens e hiperlinks para PDF?
Estou tentando converterHTML paraPDF usando o iTextSharp em umASP.NET aplicativo da web que usa ambosMVC [http://www.asp.net/mvc], e formulários da web [http://www.asp.net/web-forms]. o<img> e<a> elementos têm absoluto erelativoURLs e alguns ...
beautifulsoup: find_all no objeto ou lista bs4.element.ResultSet?
Oi, então eu aplico find_all em umbeautifulsoup objecte encontre algo, que é umbs4.element.ResultSet object ou umlist. Quero ainda encontrar find_all lá, mas não é permitido em umbs4.element.ResultSet object. Eu posso percorrer cada ...
parse html dentro do ng-bind usando angularJS [duplicado]
Esta pergunta já tem uma resposta aqui: Com ng-bind-html-unsafe removido, como injetar HTML? [/questions/19415394/with-ng-bind-html-unsafe-removed-how-do-i-inject-html] 10 respostas Estou tendo problemas com angularJs. Meu aplicativo solicita ...
Usar beautifulsoup para extrair texto entre quebras de linha (por exemplo, tags <br />)
Tenho o seguinte HTML que está dentro de um documento maior <br /> Important Text 1 <br /> <br /> Not Important Text <br /> Important Text 2 <br /> Important Text 3 <br /> <br /> Non Important Text <br /> Important Text 4 <br /> Atualmente, ...
Como alterar o nome da tag com BeautifulSoup?
Estou usando python + BeautifulSoup para analisar um documento HTM Agora preciso substituir tudo<h2 class="someclass"> elementos em um documento HTML, com<h1 class="someclass">. Como posso alterar o nome da tag sem alterar mais nada no documento?
Não é possível raspar dados
Estou começando no Script do Google Apps. Como as práticas recomendadas de codificação recomendam o uso do menor número possível de fórmulas, estou tentando fazer a raspagem na Web com o GAS Parser e depois enviar os dados para a minha ...
Erro na linha 1: o conteúdo não é permitido no prólogo
Estou tentando extrair uma tabela de dados de preços destelocal na rede Interne [https://stooq.com/q/d/?s=barc.uk&i=d] usando o seguinte código; function scrapeData() { // Retrieve table as a string using Parser. var url ...
Lendo de uma conexão de URL Java
Estou tentando ler o código html de uma conexão de URL. Em um caso, o arquivo html que estou tentando ler inclui 5 quebras de linha antes da declaração do tipo de documento real. Nesse caso, o leitor de entrada lança uma exceção para EOF. URL ...