Resultados de la búsqueda a petición "text-classification"
error de forma inconsistente MultiLabelBinarizer en y_test, sklearn clasificación multi-etiqueta
import numpy as np import pandas as pd from sklearn.pipeline import Pipeline from sklearn.feature_extraction.text import CountVectorizer from sklearn.svm import LinearSVC from sklearn.linear_model import SGDClassifier ...
R: LIME devuelve un error en diferentes números de función cuando no es el caso
Estoy creando un clasificador de texto de los tweets de Clinton y Trump (los datos se pueden encontrar en Kaggle [https://www.kaggle.com/benhamner/clinton-trump-tweets/data#]). Estoy haciendo EDA y modelando usandoquanteda ...
CountVectorizer elimina características que solo aparecen una vez
Estoy usando el paquete sklearn python y tengo problemas para crear unCountVectorizer con un diccionario pre-creado, donde elCountVectorizer no elimina las funciones que solo aparecen una vez o que no aparecen en absoluto. Aquí está el código de ...
Probar el clasificador NLTK en un archivo específico
El siguiente código correNaive Bayes clasificador de revisión de películas. El código genera una lista de las características más informativas. Nota: **movie review** la carpeta está en elnltk. from itertools import chain from nltk.corpus ...
Dimensión de forma en conv1D
He intentado construir una CNN con una capa, pero tengo algún problema. De hecho, el compilador me dice que ValueError: error al comprobar la entrada del modelo: se esperaba que conv1d_1_input tuviera 3 dimensiones, pero se obtuvo una matriz con ...
Sklearn: ROC para clasificación multiclase
Estoy haciendo diferentes experimentos de clasificación de texto. Ahora necesito calcular el AUC-ROC para cada tarea. Para las clasificaciones binarias, ya lo hice funcionar con este código: scaler = StandardScaler(with_mean=False) enc = ...
python textblob y clasificación de texto
Estoy tratando de construir un modelo de clasificación de texto con Python y textblob [https://textblob.readthedocs.org/en/dev/index.html], el script se está ejecutando en mi servidor y en el futuro la idea es que los usuarios puedan enviar su ...
Cálculo de ganancia de información con Scikit-learn
Estoy usando Scikit-learn para la clasificación de texto. Quiero calcular la ganancia de información para cada atributo con respecto a una clase en una matriz de término de documento (dispersa). La ganancia de información se define como H (Clase) ...
¿Cómo asignar una nueva observación a los clústeres de Kmeans existentes basados en la lógica de centrípodos de clúster más cercana en Python?
Utilicé el siguiente código para crear clústeres de k-means utilizando Scikit learn. kmean = KMeans(n_clusters=nclusters,n_jobs=-1,random_state=2376,max_iter=1000,n_init=1000,algorithm='full',init='k-means++') kmean_fit = ...
¿Cómo utilizar el clasificador de chispas Naive Bayes para la clasificación de texto con IDF?
Quiero convertir documentos de texto en vectores de características usando tf-idf, y luego entrenar un algoritmo ingenuo de bayes para clasificarlos. Puedo cargar fácilmente mis archivos de texto sin las etiquetas y usar HashingTF () para ...
Página 1 de 2