Resultados da pesquisa a pedido "corpus"

4 a resposta

Como posso alterar o tempo limite de conexão padrão do Mysql ao conectar através de python?

Eu me conectei a um banco de dados mysql usando python

1 a resposta

Faça o dataframe dos top N termos frequentes para vários corpora usando o pacote tm em R

Tenho vários

3 a resposta

Precisa de dicionário de inglês gratuito ou Corpus, em última análise, para um banco de dados MySQL [fechado]

Eu estou tentando encontrar um dicionário para download gratuito (ou Corpus pode ser a melhor palavra) que eu possa importar para o MySQL. Eu preciso de pala...

2 a resposta

Como "atualizar" um modelo existente de Reconhecimento de Entidades Nomeadas - em vez de criar do zero?

Consulte as etapas do tutorial para o OpenNLP - reconhecimento de entidade nomeada:Link para o tutorial [https://opennlp.apache.org/documentation/1.5.3/manual/opennlp.html]Estou usando o modelo "en-ner-person.bin" ...

4 a resposta

Erro DocumentTermMatrix no argumento Corpus

Eu tenho o seguinte código: # returns string w/o leading or trailing whitespace trim <- function (x) gsub("^\\s+|\\s+$", "", x) news_corpus <- Corpus(VectorSource(news_raw$text)) # a column of strings. corpus_clean <- tm_map(news_corpus, ...

1 a resposta

No pacote R tm, construa o corpus FROM Document-Term-Matrix

É simples criar uma matriz de termos de documento a partir de um corpus com o pacote tm. Eu gostaria de construir um corpus a partir de uma matriz termo-documento. Seja M o número de documentos em um conjunto de documentos. Seja V o número ...

3 a resposta

R Corpus está bagunçando meu texto codificado em UTF-8

Estou simplesmente tentando criar um corpus a partir de russo, texto codificado em UTF-8. O problema é que o método Corpus dotm O pacote não está codificando as seqüências corretamente. Aqui está um exemplo reproduzível do meu ...

4 a resposta

Meios mais eficientes de criar um corpus e DTM com 4 milhões de linhas

Meu arquivo tem mais de 4 milhões de linhas e preciso de uma maneira mais eficiente de converter meus dados em uma matriz de termos de corpus e documento, para que eu possa passá-los para um classificador bayesiano. Considere o seguinte ...

2 a resposta

Como selecionar apenas um subconjunto de termos de corpus para a criação de TermDocumentMatrix no tm

Eu tenho um corpus enorme e estou interessado apenas na aparência de um punhado de termos que conheço desde o início. Existe uma maneira de criar um termo matriz de documentos a partir do corpus usando otm pacote, onde apenas os termos que eu ...

3 a resposta

Procurando conjunto de dados para testar pesquisas no estilo FULLTEXT em [fechado]

Estou procurando um corpus de texto para executar algumas pesquisas de dados de estilo de texto completo. Ou algo que eu possa baixar ou um sistema que o gera. Algo um pouco mais aleatório seria melhor, por exemplo. 1.000.000 de artigos ...