Resultados de la búsqueda a petición "text-classification"
R: LIME devuelve un error en diferentes números de función cuando no es el caso
Estoy creando un clasificador de texto de los tweets de Clinton y Trump (los datos se pueden encontrar en Kaggle [https://www.kaggle.com/benhamner/clinton-trump-tweets/data#]). Estoy haciendo EDA y modelando usandoquanteda ...
Cálculo de ganancia de información con Scikit-learn
Estoy usando Scikit-learn para la clasificación de texto. Quiero calcular la ganancia de información para cada atributo con respecto a una clase en una matriz de término de documento (dispersa). La ganancia de información se define como H (Clase) ...
Sklearn: ROC para clasificación multiclase
Estoy haciendo diferentes experimentos de clasificación de texto. Ahora necesito calcular el AUC-ROC para cada tarea. Para las clasificaciones binarias, ya lo hice funcionar con este código: scaler = StandardScaler(with_mean=False) enc = ...
error de forma inconsistente MultiLabelBinarizer en y_test, sklearn clasificación multi-etiqueta
import numpy as np import pandas as pd from sklearn.pipeline import Pipeline from sklearn.feature_extraction.text import CountVectorizer from sklearn.svm import LinearSVC from sklearn.linear_model import SGDClassifier ...
Dimensión de forma en conv1D
He intentado construir una CNN con una capa, pero tengo algún problema. De hecho, el compilador me dice que ValueError: error al comprobar la entrada del modelo: se esperaba que conv1d_1_input tuviera 3 dimensiones, pero se obtuvo una matriz con ...
¿Cómo asignar una nueva observación a los clústeres de Kmeans existentes basados en la lógica de centrípodos de clúster más cercana en Python?
Utilicé el siguiente código para crear clústeres de k-means utilizando Scikit learn. kmean = KMeans(n_clusters=nclusters,n_jobs=-1,random_state=2376,max_iter=1000,n_init=1000,algorithm='full',init='k-means++') kmean_fit = ...
Advertencia del usuario: etiqueta no: NÚMERO: está presente en todos los ejemplos de capacitación
Estoy haciendo una clasificación de múltiples etiquetas, donde trato de predecir las etiquetas correctas para cada documento y aquí está mi código: mlb = MultiLabelBinarizer() X = dataframe['body'].values y ...
python textblob y clasificación de texto
Estoy tratando de construir un modelo de clasificación de texto con Python y textblob [https://textblob.readthedocs.org/en/dev/index.html], el script se está ejecutando en mi servidor y en el futuro la idea es que los usuarios puedan enviar su ...
¿Cómo utilizar el clasificador de chispas Naive Bayes para la clasificación de texto con IDF?
Quiero convertir documentos de texto en vectores de características usando tf-idf, y luego entrenar un algoritmo ingenuo de bayes para clasificarlos. Puedo cargar fácilmente mis archivos de texto sin las etiquetas y usar HashingTF () para ...
Probar el clasificador NLTK en un archivo específico
El siguiente código correNaive Bayes clasificador de revisión de películas. El código genera una lista de las características más informativas. Nota: **movie review** la carpeta está en elnltk. from itertools import chain from nltk.corpus ...
Página 1 de 2