Чтобы получить исторические котировки Yahoo с 3 марта 2012 года по 5 марта 2012 года.
аюсь получить цены на акции, просматривая страницы финансов Google, я делаю это на python, использую пакет urllib, а затем использую регулярное выражение для получения ценовых данных.
Когда я оставляю свой скрипт Python запущенным, он сначала работает некоторое время (несколько минут), а затем начинает выдавать исключение [Ошибка HTTP 503: служба недоступна]
Я предполагаю, что это происходит, потому что на стороне веб-сервера он обнаруживает частые обновления страницы как робот и выдает это исключение через некоторое время.
есть ли способ обойти это, то есть удалить некоторые cookie или создать некоторые cookie и т. д.
или даже лучше, если Google дает API, я хочу сделать это на Python, потому что полное приложение на Python, но если в Python нет ничего доступного для этого, я могу рассмотреть альтернативы. Это мой метод python, который я использую в цикле для получения данных (после нескольких секунд сна я вызываю этот метод в цикле)
def getPriceFromGOOGLE(self, symbol):
"""
gets last traded price from google for given security
"""
toReturn = 0.0
try:
base_url = 'http://google.com/finance?q='
req = urllib2.Request(base_url + symbol)
content = urllib2.urlopen(req).read()
namestr = 'name:\"' + symbol + '\",cp:(.*),p:(.*),cid(.*)}'
m = re.search(namestr, content)
if m:
data = str(m.group(2).strip().strip('"'))
price = data.replace(',','')
toReturn = float(price)
else:
print 'ERROR ' + str(symbol) + ' --- ' + str(content)
except Exception, exc:
print 'Exc: ' + str(exc)
finally:
return toReturn