Resultados de la búsqueda a petición "text-classification"

1 la respuesta

error de forma inconsistente MultiLabelBinarizer en y_test, sklearn clasificación multi-etiqueta

import numpy as np import pandas as pd from sklearn.pipeline import Pipeline from sklearn.feature_extraction.text import CountVectorizer from sklearn.svm import LinearSVC from sklearn.linear_model import SGDClassifier ...

1 la respuesta

R: LIME devuelve un error en diferentes números de función cuando no es el caso

Estoy creando un clasificador de texto de los tweets de Clinton y Trump (los datos se pueden encontrar en Kaggle [https://www.kaggle.com/benhamner/clinton-trump-tweets/data#]). Estoy haciendo EDA y modelando usandoquanteda ...

1 la respuesta

CountVectorizer elimina características que solo aparecen una vez

Estoy usando el paquete sklearn python y tengo problemas para crear unCountVectorizer con un diccionario pre-creado, donde elCountVectorizer no elimina las funciones que solo aparecen una vez o que no aparecen en absoluto. Aquí está el código de ...

2 la respuesta

Probar el clasificador NLTK en un archivo específico

El siguiente código correNaive Bayes clasificador de revisión de películas. El código genera una lista de las características más informativas. Nota: **movie review** la carpeta está en elnltk. from itertools import chain from nltk.corpus ...

3 la respuesta

Dimensión de forma en conv1D

He intentado construir una CNN con una capa, pero tengo algún problema. De hecho, el compilador me dice que ValueError: error al comprobar la entrada del modelo: se esperaba que conv1d_1_input tuviera 3 dimensiones, pero se obtuvo una matriz con ...

1 la respuesta

Sklearn: ROC para clasificación multiclase

Estoy haciendo diferentes experimentos de clasificación de texto. Ahora necesito calcular el AUC-ROC para cada tarea. Para las clasificaciones binarias, ya lo hice funcionar con este código: scaler = StandardScaler(with_mean=False) enc = ...

1 la respuesta

python textblob y clasificación de texto

Estoy tratando de construir un modelo de clasificación de texto con Python y textblob [https://textblob.readthedocs.org/en/dev/index.html], el script se está ejecutando en mi servidor y en el futuro la idea es que los usuarios puedan enviar su ...

1 la respuesta

Cálculo de ganancia de información con Scikit-learn

Estoy usando Scikit-learn para la clasificación de texto. Quiero calcular la ganancia de información para cada atributo con respecto a una clase en una matriz de término de documento (dispersa). La ganancia de información se define como H (Clase) ...

1 la respuesta

¿Cómo asignar una nueva observación a los clústeres de Kmeans existentes basados en la lógica de centrípodos de clúster más cercana en Python?

Utilicé el siguiente código para crear clústeres de k-means utilizando Scikit learn. kmean = KMeans(n_clusters=nclusters,n_jobs=-1,random_state=2376,max_iter=1000,n_init=1000,algorithm='full',init='k-means++') kmean_fit = ...

1 la respuesta

¿Cómo utilizar el clasificador de chispas Naive Bayes para la clasificación de texto con IDF?

Quiero convertir documentos de texto en vectores de características usando tf-idf, y luego entrenar un algoritmo ingenuo de bayes para clasificarlos. Puedo cargar fácilmente mis archivos de texto sin las etiquetas y usar HashingTF () para ...