Python nltk download i download_shell zarówno zamrażają (zawieszają się) przy próbie punktowej
Korzystanie z NLTK 2.0.4. zainstalowany dla Pythona-2.7.3 EPD (nie Baldachim). w Ubuntu 12.10. W terminalu wpisuję:
In [96]: nltk.download_shell()
NLTK Downloader
---------------------------------------------------------------------------
d) Download l) List u) Update c) Config h) Help q) Quit
---------------------------------------------------------------------------
Downloader> d
Download which package (l=list; x=cancel)?
Identifier> punkt
Downloading package 'punkt' to /home/espears/nltk_data...
A potem zamarza. Odpowiedni plik punkt.zip jest zapisywany w podanym katalogu, aledownload
interfejs nigdy się nie zrzeka.
Ten przykład jest z IPythonem, ale spróbowałem tego samego ze zwykłym interpreterem Pythona 2.7.3 i uzyskałem taki sam wynik.
Kiedy próbuję użyćunzip
aby rozpakować plik bezpośrednio, widzę błędy mówiące, że właściwy centralny kod zip nie został znaleziony w pliku i nie można go rozpakować. Zobacz poniżej:
espears@computer ~/nltk_data/tokenizers $ unzip punkt.zip
Archive: punkt.zip
End-of-central-directory signature not found. Either this file is not
a zipfile, or it constitutes one disk of a multi-part archive. In the
latter case the central directory and zipfile comment will be found on
the last disk(s) of this archive.
unzip: cannot find zipfile directory in one of punkt.zip or
punkt.zip.zip, and cannot find punkt.zip.ZIP, period.
Dzieje się tak z obydwomanltk.download()
inltk.download_shell()
w ten sam sposób.
Mogę sprawdzić plik .zip za pomocądu
aby zobaczyć, że początkowo jego rozmiar rośnie od 0 MB do około 2,7 MB, więc to rzeczywiście coś pobiera, a plik nie jest pusty. Ale zatrzymuje się na 2,7 MB (co może, ale nie musi odpowiadać oczekiwanemu pełnemu rozmiarowi pliku), a następnie downloader powłoki Pythona zawiesza się.