Resultados da pesquisa a pedido "text-mining"
"RTextTools" create_matrix obteve um erro
Eu estava executando o pacote RTextTools para criar um modelo de classificação de texto. E quando preparo o conjunto de dados de previsão e tentei transformá-lo em matriz. Eu recebi o erro como: Error in if (attr(weighting, "Acronym") == ...
Como encontrar a palavra mais próxima de um vetor usando word2vec
Acabei de começar a usar o Word2vec e fiquei imaginando como podemos encontrar a palavra mais próxima de um vetor. Eu tenho esse vetor que é o vetor médio para um conjunto de vetores: array([-0.00449447, -0.00310097, 0.02421786, ...], ...
por que dois vetores não é similaridade, mas o resultado é 1?
Estou usando a fórmula Cosine Similarity para calcular a similaridade entre dois vetores. Eu tentei dois vetores diferentes como este: Vector1 (-1237373741, 27, 1, 1, 331289590, 1818540802) Vector2 (-1237373741, 49, 1, 1, 331289590, ...
Cluster de sentenças Doc2Vec
Eu tenho vários documentos que contêm várias frases. Eu quero usardoc2vecpara agrupar (por exemplo, k-means) os vetores de sentença usandosklearn. Como tal, a ideia é que sentenças semelhantes sejam agrupadas em vários grupos. No entanto, não ...
Como recriar o mesmo DocumentTermMatrix com novos dados (teste)
Suponha que eu tenha dados de treinamento baseados em texto e dados de teste. Para ser mais específico, tenho dois conjuntos de dados - treinamento e teste -...
Comportamento inconsistente com funções de transformação tm_map ao usar vários núcleos
Outro título em potencial para este post pode ser "Quando o processamento paralelo em r, a relação entre o número de núcleos, o tamanho do pedaço de loop e o tamanho do objeto é importante?" Eu tenho um corpus, estou executando algumas ...
Como acessar a Wikipedia a partir de R?
Existe algum pacote para R que permita consultar a Wikipedia (provavelmente usando a API Mediawiki) para obter uma lista dos artigos disponíveis relevantes para essa consulta, bem como importar artigos selecionados para mineração de texto?
Agrupando texto no MATLAB
Quero fazer agrupamentos aglomerativos hierárquicos em textos no MATLAB. Diga, eu tenho quatro frases, I have a pen. I have a paper. I have a pencil. I have a cat.Quero agrupar as quatro frases acima para ver quais são mais semelhantes. Eu sei ...