Resultados da pesquisa a pedido "text-classification"

1 a resposta

CountVectorizer excluindo recursos que aparecem apenas uma vez

Estou usando o pacote sklearn python e estou tendo problemas para criar umCountVectorizer com um dicionário pré-criado, onde oCountVectorizer não exclui recursos que aparecem apenas uma vez ou nem aparecem. Aqui está o código de exemplo que eu ...

2 a resposta

Dicionário léxico para palavras sinônimas

Existem poucos dicionários disponíveis para processamento de linguagem natural. Como dicionários de palavras positivas, negativas etc. Existe algum dicionário disponível que contenha uma lista de sinônimos para todas as palavras do ...

1 a resposta

python textblob e classificação de texto

Estou tentando criar um modelo de classificação de texto com python etextblob [https://textblob.readthedocs.org/en/dev/index.html], o script está sendo executado no meu servidor e, no futuro, a idéia é que os usuários possam enviar seus textos e ...

2 a resposta

UserWarning: Label not: NUMBER: está presente em todos os exemplos de treinamento

Estou fazendo uma classificação multilabel, onde tento prever os rótulos corretos para cada documento e aqui está o meu código: mlb = MultiLabelBinarizer() X = dataframe['body'].values y = mlb.fit_transform(dataframe['tag'].values) classifier = ...

1 a resposta

Cálculo do ganho de informações com o Scikit-learn

Estou usando o Scikit-learn para classificação de texto. Quero calcular o ganho de informações para cada atributo em relação a uma classe em uma matriz de termo de documento (esparsa). O ganho de informação é definido como H (Classe) - H (Classe ...

1 a resposta

R: LIME retorna erro em diferentes números de recurso quando não é o caso

Estou criando um classificador de texto dos tweets de Clinton e Trump (os dados podem ser encontrados emKaggle [https://www.kaggle.com/benhamner/clinton-trump-tweets/data#]) Estou fazendo EDA e modelando usandoquanteda pacote: library(dplyr) ...

1 a resposta

Scikit learn - fit_transform no conjunto de testes

Estou lutando para usar a Random Forest em Python com o Scikit learn. Meu problema é que eu o uso para classificação de texto (em 3 classes - positivo / negativo / neutro) e os recursos que extraio são principalmente palavras / unigramas, por ...

1 a resposta

Como usar o classificador spark Naive Bayes para classificação de texto com IDF?

Quero converter documentos de texto em vetores de recurso usando tf-idf e treinar um algoritmo ingênuo de bayes para classificá-los. Posso carregar facilmente meus arquivos de texto sem os rótulos e usar HashingTF () para convertê-lo em um vetor ...

3 a resposta

Dimensão da forma em conv1D

Eu tentei criar uma CNN com uma camada, mas tenho algum problema com ela. De fato, o compilador me diz que ValueError: Erro ao verificar a entrada do modelo: conv1d_1_input esperado para ter 3 dimensões, mas obteve matriz com forma (569, ...

1 a resposta

Como classificar URLs? o que são recursos de URLs? Como selecionar e extrair recursos do URL

Comecei a trabalhar em um problema de classificação. É um problema de duas classes, meu modelo treinado (Machine Learning) terá que decidir / prever ou permitir um URL ou bloqueá-lo. Minha pergunta é muito específica. Como classificar URLs? ...