Веб-сканер для извлечения из элементов списка

Question

Jan 11, 2015, 07:07 AM

python web-crawler web-scraping parsing beautifulsoup

Веб-сканер для извлечения из элементов списка

Я пытаюсь извлечь из<li> помечает даты и сохраняет их в файле Excel.

<li>January 13, 1991: At least 40 people <a href ="......."> </a> </li>

Код:

import urllib2
import os 
from datetime import datetime
import re
os.environ["LANG"]="en_US.UTF-8"
from bs4 import BeautifulSoup

page1 = urllib2.urlopen("http://en.wikipedia.org/wiki/List_of_human_stampedes")
soup = BeautifulSoup(page1)
li =soup.find_all("li")
count = 0
while count < len(li):
   soup = BeautifulSoup(li[count])
   date_string, rest = soup.li.text.split(':', 1)
   print datetime.strptime(date_string, '%B %d, %Y').strftime('%d/%m/%Y')
   count+=1

Ошибка:

Traceback (most recent call last):
  File "C:\Users\sony\Desktop\Trash\Crawler Try\trytest.py", line 13, in <module>
    soup =BeautifulSoup(li[count])
  File "C:\Python27\lib\site-packages\bs4\__init__.py", line 161, in __init__
    markup = markup.read()
TypeError: 'NoneType' object is not callable
[Finished in 4.0s with exit code 1]

Я не знаю, как написать каждый текст, извлеченный в Excel таким образом. Не включил в него код. Задайте вопрос:Веб-сканер для извлечения между списком

Веб-сканер для извлечения из элементов списка

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Веб-сканер для извлечения из элементов списка

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы