Resultados da pesquisa a pedido "beautifulsoup"

1 a resposta

Adicione tags pai com uma sopa bonita

Eu tenho muitas páginas de HTML com várias seções contendo esses trechos de código:

7 a resposta

Analisando HTML em python - lxml ou BeautifulSoup? Qual destes é melhor para que tipos de propósitos?

Pelo que eu sei, as duas principais bibliotecas de análise HTML no Python são lxml e BeautifulSoup. Eu escolhi o BeautifulSoup para um projeto no qual estou ...

4 a resposta

Como reinstalar o lxml?

3 a resposta

Python BeautifulSoup não raspa esse URL

Estou tentando raspar algumas linhas de dados do jogador (tr) de um URL, no entanto, nada parece acontecer quando executo meu código. Estou certo de que meu código está bom porque funciona com outros sites estatísticos que contêm tabelas. Alguém ...

2 a resposta

Obter texto de tags HTML sem texto de tags filho internas

Exemplo: Às vezes, o HTML é: <div id="1"> <div id="2"> this is the text i do NOT want </div> this is the text i want here </div>Outras vezes, é apenas: <div id="1"> this is the text i want here </div>Quero obter apenas o texto em uma tag e ...

2 a resposta

Análise Html com Beautiful Soup retorna lista vazia

4 a resposta

Uso de memória alta em Python com o BeautifulSoup

Eu estava tentando processar várias páginas da web com o BeautifulSoup4 no python 2.7.3, mas após cada análise o uso da memória sobe e sobe.Esse código simpl...

2 a resposta

Como gravar a saída no arquivo html com o Python BeautifulSoup

Modifiquei um arquivo html removendo algumas das tags usandobeautifulsoup. Agora eu quero escrever os resultados novamente em um arquivo html. Meu código: from bs4 import BeautifulSoup from bs4 import Comment soup ...

2 a resposta

Usando SoupStrainer para analisar seletivamente

Estou tentando analisar uma lista de títulos de videogames em um site de compras. no entanto, como a lista de itens é toda armazenada dentro de uma ...

3 a resposta

BeautifulSoup (html) não está funcionando, dizendo não pode chamar o módulo?

import urllib2 import urllib from BeautifulSoup import BeautifulSoup # html from BeautifulSoup import BeautifulStoneSoup # xml import BeautifulSoup # everything import re f = o.open( 'http://www.google.com', p) html = f.read() f.close() soup = ...