nltk не добавляет $ NLTK_DATA к пути поиска?
под Linux я установил env var $ NLTK_DATA ('/ home / user / data / nltk'), и проверка работала как положено
>>> from nltk.corpus import brown
>>> brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]
но при запуске другого скрипта Python я получил:
LookupError:
**********************************************************************
Resource u'tokenizers/punkt/english.pickle' not found. Please
use the NLTK Downloader to obtain the resource: >>>
nltk.download()
Searched in:
- '/home/user/nltk_data'
- '/usr/share/nltk_data'
- '/usr/local/share/nltk_data'
- '/usr/lib/nltk_data'
- '/usr/local/lib/nltk_data'
- u''
Как мы видим, nltk не добавляет $ NLTK_DATA в путь поиска после добавления каталога NLTK_DATA вручную:
nltk.data.path.append("/NLTK_DATA_DIR");
Сценарий работает, как и ожидалось, вопрос:
Как заставить nltk автоматически добавлять $ NLTK_DATA в путь поиска?