Resultados da pesquisa a pedido "beautifulsoup"
Faixa de tags HTML para obter seqüências de caracteres em python
Tentei obter algumas seqüências de caracteres de um arquivo HTML com BeautifulSoup e toda vez que trabalho com ele, obtenho resultados parciais. Eu quero obter as seqüências de caracteres em cada elemento li / tag. Até agora, consegui obter tudo ...
elemento clone com beautifulsoup
Tenho que copiar uma parte de um documento para outro, mas não quero modificar o documento do qual copio. Se eu usar.extract() remove o elemento da árvore. Se eu apenas acrescentar o elemento selecionado comodocument2.append(document1.tag) ainda ...
Análise de entrada de formulário de sopa bonita em Python
Meu objetivo é obter uma lista de todos os nomes e valores de entrada. Para emparelhá-los e enviar o formulário. Os nomes e valores são aleatórios. from bs4 import BeautifulSoup # parsing html = """ <html> <head id="Head1"><title>Title ...
Como retornar html de uma página usando robobrowser
Estou experimentandohttp://robobrowser.readthedocs.org/en/latest/readme.html [http://robobrowser.readthedocs.org/en/latest/readme.html], uma nova biblioteca python baseada na bela biblioteca de sopas. Estou tentando testá-lo abrindo uma página ...
tabela de análise python BeautifulSoup
Estou aprendendo pythonrequests e BeautifulSoup. Para um exercício, escolhi escrever um rápido analisador de multas de estacionamento em Nova York. Eu sou capaz de obter uma resposta html que é bastante feia. Eu preciso pegar olineItemsTable e ...
Solicitações de Python: orders.exceptions.TooManyRedirects: Excedeu 30 redirecionamentos
Eu estava tentando rastrear esta página usando a biblioteca de solicitações python import requests from lxml import etree,html url = 'http://www.amazon.in/b/ref=sa_menu_mobile_elec_all?ie=UTF8&node=976419031' r = requests.get(url) tree = ...
Clicando no link usando beautifulsoup em python
Na mecanização, clicamos nos links usando follow_link ou click_link. Existe um tipo similar de coisa na sopa bonita para clicar em um link em uma página da web?
Analisando JS com Sopa Bonita
Tenho uma página analisada com uma bela sopa. Mas lá tenho o código js: <script type="text/javascript"> var utag_data = { customer_id : "_PHL2883198554", customer_type : "New", loyalty_id : "N", declined_loyalty_interstitial : "false", ...
bs4.FeatureNotFound: Não foi possível encontrar um construtor de árvores com os recursos que você solicitou: lxml. Você precisa instalar uma biblioteca analisadora?
... soup = BeautifulSoup(html, "lxml") File "/Library/Python/2.7/site-packages/bs4/__init__.py", line 152, in __init__ % ",".join(features)) bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to ...
Maneira mais rápida do que "tentar" e "exceto"? - Pitão
Muitas vezes, tenho o código escrito da seguinte maneira try: self.title = item.title().content.string except AttributeError, e: self.title = NoneExiste uma maneira mais rápida de lidar com isso? um one-liner?