Веб-сканер для извлечения из элементов списка
Я пытаюсь извлечь из<li>
помечает даты и сохраняет их в файле Excel.
<li>January 13, 1991: At least 40 people <a href ="......."> </a> </li>
Код:
import urllib2
import os
from datetime import datetime
import re
os.environ["LANG"]="en_US.UTF-8"
from bs4 import BeautifulSoup
page1 = urllib2.urlopen("http://en.wikipedia.org/wiki/List_of_human_stampedes")
soup = BeautifulSoup(page1)
li =soup.find_all("li")
count = 0
while count < len(li):
soup = BeautifulSoup(li[count])
date_string, rest = soup.li.text.split(':', 1)
print datetime.strptime(date_string, '%B %d, %Y').strftime('%d/%m/%Y')
count+=1
Ошибка:
Traceback (most recent call last):
File "C:\Users\sony\Desktop\Trash\Crawler Try\trytest.py", line 13, in <module>
soup =BeautifulSoup(li[count])
File "C:\Python27\lib\site-packages\bs4\__init__.py", line 161, in __init__
markup = markup.read()
TypeError: 'NoneType' object is not callable
[Finished in 4.0s with exit code 1]
Я не знаю, как написать каждый текст, извлеченный в Excel таким образом. Не включил в него код. Задайте вопрос:Веб-сканер для извлечения между списком