Resultados da pesquisa a pedido "text-mining"

1 a resposta

"RTextTools" create_matrix obteve um erro

Eu estava executando o pacote RTextTools para criar um modelo de classificação de texto. E quando preparo o conjunto de dados de previsão e tentei transformá-lo em matriz. Eu recebi o erro como: Error in if (attr(weighting, "Acronym") == ...

1 a resposta

Como encontrar a palavra mais próxima de um vetor usando word2vec

Acabei de começar a usar o Word2vec e fiquei imaginando como podemos encontrar a palavra mais próxima de um vetor. Eu tenho esse vetor que é o vetor médio para um conjunto de vetores: array([-0.00449447, -0.00310097, 0.02421786, ...], ...

2 a resposta

Mineração de texto com o pacote tm - palavra stemming

1 a resposta

por que dois vetores não é similaridade, mas o resultado é 1?

Estou usando a fórmula Cosine Similarity para calcular a similaridade entre dois vetores. Eu tentei dois vetores diferentes como este: Vector1 (-1237373741, 27, 1, 1, 331289590, 1818540802) Vector2 (-1237373741, 49, 1, 1, 331289590, ...

2 a resposta

Cluster de sentenças Doc2Vec

Eu tenho vários documentos que contêm várias frases. Eu quero usardoc2vecpara agrupar (por exemplo, k-means) os vetores de sentença usandosklearn. Como tal, a ideia é que sentenças semelhantes sejam agrupadas em vários grupos. No entanto, não ...

2 a resposta

Como recriar o mesmo DocumentTermMatrix com novos dados (teste)

Suponha que eu tenha dados de treinamento baseados em texto e dados de teste. Para ser mais específico, tenho dois conjuntos de dados - treinamento e teste -...

0 a resposta

Comportamento inconsistente com funções de transformação tm_map ao usar vários núcleos

Outro título em potencial para este post pode ser "Quando o processamento paralelo em r, a relação entre o número de núcleos, o tamanho do pedaço de loop e o tamanho do objeto é importante?" Eu tenho um corpus, estou executando algumas ...

2 a resposta

Como acessar a Wikipedia a partir de R?

Existe algum pacote para R que permita consultar a Wikipedia (provavelmente usando a API Mediawiki) para obter uma lista dos artigos disponíveis relevantes para essa consulta, bem como importar artigos selecionados para mineração de texto?

11 a resposta

Como determinar a linguagem (natural) de um documento?

1 a resposta

Agrupando texto no MATLAB

Quero fazer agrupamentos aglomerativos hierárquicos em textos no MATLAB. Diga, eu tenho quatro frases, I have a pen. I have a paper. I have a pencil. I have a cat.Quero agrupar as quatro frases acima para ver quais são mais semelhantes. Eu sei ...