Como treinar o algoritmo GloVe no meu próprio corpus
Eu tentei seguiresta.
Mas de alguma maneira eu perdi muito tempo, acabando sem nada útil.
Eu só quero treinar umGloVe
modelo no meu próprio corpus (~ arquivo de 900Mb corpus.txt). Eu baixei os arquivos fornecidos no link acima e compilei usandocygwin
(depois de editar o arquivo demo.sh e alterá-lo paraVOCAB_FILE=corpus.txt
. eu deveria sairCORPUS=text8
inalterado?) a saída foi:
Como posso usar esses arquivos para carregá-lo como umGloVe
modelo em python?