Resultados da pesquisa a pedido "text-mining"

2 a resposta

arquivos PDF de mina de texto com Python?

1 a resposta

findAssocs para vários termos em R

Em R eu usei o

1 a resposta

R Texto de arrumação e erro unnest_tokens

Muito novo no R e começou a usar o pacote tidytext. Estou tentando usar argumentos para alimentar ounnest_tokens função para que eu possa fazer várias análises de coluna. Então, ao invés disso library(janeaustenr) library(tidytext) ...

6 a resposta

lista de frequências de palavras usando R

Eu tenho usado o pacote tm para executar alguma análise de texto. Meu problema é com a criação de uma lista com palavras e suas freqüências associadas com o ...

1 a resposta

Use scikit-learn TfIdf com gensim LDA

Eu usei várias versões do TFIDF no scikit aprender a modelar alguns dados de texto.

4 a resposta

Encontrando ngrams em R e comparando ngrams em corpora

Estou começando com o pacote tm em R, então por favor, tenha paciência comigo e peço desculpas pela grande e velha parede de texto. Eu criei um corpus razoav...

1 a resposta

Como dividir os dados da conversa em pares de (Contexto, Resposta)

Estou usando o modelo Gensim Doc2Vec, tentando agrupar partes de conversas de suporte ao cliente. Meu objetivo é fornecer à equipe de suporte sugestões de respostas automáticas. Figura 1:mostra uma amostra de conversas em que a pergunta do ...

2 a resposta

quadro de dados do tfidf com python

Eu tenho que classificar alguns sentimentos meu quadro de dados é assim Phrase Sentiment is it good movie positive wooow is it very goode positive bad movie negativeEu fiz algum pré-processamento como tokenização parar palavras decorrentes etc ...

1 a resposta

por que dois vetores não é similaridade, mas o resultado é 1?

Estou usando a fórmula Cosine Similarity para calcular a similaridade entre dois vetores. Eu tentei dois vetores diferentes como este: Vector1 (-1237373741, 27, 1, 1, 331289590, 1818540802) Vector2 (-1237373741, 49, 1, 1, 331289590, ...

2 a resposta

Cluster de sentenças Doc2Vec

Eu tenho vários documentos que contêm várias frases. Eu quero usardoc2vecpara agrupar (por exemplo, k-means) os vetores de sentença usandosklearn. Como tal, a ideia é que sentenças semelhantes sejam agrupadas em vários grupos. No entanto, não ...