Невозможно загрузить данные nltk

import nltk
nltk.download()

Это показывает[SSL:CERTIFICATE_VERIFY_FAILED], В случаеrequests можно использоватьverify=Falseно что тут делать.

ОБНОВИТЬ:

Эта ошибка сохраняется в Python 3.6, с NLTK 3.0, в Mac OS X 10.7.5:

Изменение индекса в загрузчике NLTK (рекомендуетсяВот) позволяет загрузчику показывать все файлы NLTK, но когда кто-то пытается загрузить все, он получает другую ошибку SSL (см. внизу фотографии):

 user30588319 февр. 2017 г., 21:51
Хлопот. То же самое здесь Python 3.6 на Mac
 SAMO02 авг. 2016 г., 18:11
Вы уверены, что используете самую последнюю версию nltk и, возможно, попробуйте nltk.download ('all')?
 Teodora kulikov02 авг. 2016 г., 18:20
нет, это не сработало
 GoldenGremlin27 дек. 2016 г., 16:41
У меня также есть эта ошибка с Python 3.6 и NLTK 3.0 на Mac OS X 10.7.5. Я еще не нашел решение.
 RAVI03 авг. 2016 г., 07:12

Ответы на вопрос(5)

В MacOS 10.12.6 это было решено введением следующего в терминале bash

pip install certifi
/Applications/Python\ 3.6/Install\ Certificates.command

тогда у меня работал обычный способ установки nltk corpora

import nltk
nltk.download()

так и SpaCy. В соответствии с инструкциями вэтот вопросЯ смог преодолеть проблему. Попробуйте запустить/Applications/Python\ 3.6/Install\ Certificates.commandзатем повторите попытку загрузки NLTK

(Добавление SEO сертификата не удалось _ssl..)

Решено для меня на Mac, 10.12.2 с помощью совета Пола Барри о загрузке через Python 2.7 (я не могу комментировать, потому что респ <50)

Дополнительные проблемы обнаружены и исправлены: Чтобы иметь возможность загружать NLTK через python 2.7 (настройка по умолчанию для Mac Python 2.7), мне также пришлось добавить папку Python в /.bash_profile какэтот комментарий показывает.

Затем, поскольку я установил эту переменную пути для 2.7, мне пришлось удалить ее после загрузки корпуса, чтобы иметь возможность запустить python3. Поэтому удалите его из /.bash_profile перед запуском python3.

После всего этого я могу без проблем запускать «import nltk» и «from nltk.book import *».

tokenizer/punkt Данные вы можете скачать напрямую по адресу:

https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/packages/tokenizers/punkt.zip

и поместите извлеченную папку в папку C: \ nltk_data \ tokenizers.

это немного хакерство, но вот что я должен был сделать, чтобы иметь возможность использовать различные файлы данных NLTK в Python 3.x на моем ноутбуке Mac (под управлением macOS 10.12.2).

Во-первых, обратите внимание, что ошибка сертификата возникает, только когда я пытаюсь загрузить данные NLTK с помощью Python 3.x на моем Mac (моя виртуальная машина Ubuntu внутри VirtualBox не имела такой ошибки при использовании Python 3.x - что раздражает). Я не знаю, почему это приводит к ошибке на моем Mac, тем более что модуль NLTK устанавливается в Python 3.x с использованиемpip без проблем. Это соединение с сервером загрузки NLTK, которое, как представляется, вызывает проблему проверки SSL.

Мой ах! настал момент, когда я понял, что NLTK - при установке в Python 3.x или Python 2.x - имеет одинаковую структуру каталогов среди всех версий Python, установленных на любом компьютере. Итак, для установки NLTK я использовал Python 2.x, предустановленный на macOS, а затем использовалnltk.download() в Python 2.x для установки корпуса стоп-слов без проблем. Сделав это (в Python 2.x), я вернулся в Python 3.x, и этот код работал:

import nltk
from nltk.corpus import stopwords
print(stopwords.words('english'))

Как я уже сказал, это немного взломано, но этот метод позволяет мне установить данные NLTK с помощью Python 2.x, которые я могу обработать с помощью Python 3.x по мере необходимости.

Ваш ответ на вопрос