Resultados de la búsqueda a petición "text-classification"
Scikit learn - fit_transform en el conjunto de prueba
Estoy luchando por usar Random Forest en Python con Scikit learn. Mi problema es que lo uso para la clasificación de texto (en 3 clases: positivo / negativo / neutro) y las características que extraigo son principalmente palabras / unigramas, por ...
¿Cómo clasificar las URL? ¿Cuáles son las características de las URL? Cómo seleccionar y extraer características de URL
Acabo de comenzar a trabajar en un problema de clasificación. Es un problema de dos clases, mi modelo entrenado (Machine Learning) tendrá que decidir / predecir si se debe permitir una URL o bloquearla. Mi pregunta es muy específica. ¿Cómo ...
CountVectorizer elimina características que solo aparecen una vez
Estoy usando el paquete sklearn python y tengo problemas para crear unCountVectorizer con un diccionario pre-creado, donde elCountVectorizer no elimina las funciones que solo aparecen una vez o que no aparecen en absoluto. Aquí está el código de ...
Probar el clasificador NLTK en un archivo específico
El siguiente código correNaive Bayes clasificador de revisión de películas. El código genera una lista de las características más informativas. Nota: **movie review** la carpeta está en elnltk. from itertools import chain from nltk.corpus ...
¿Cómo utilizar el clasificador de chispas Naive Bayes para la clasificación de texto con IDF?
Quiero convertir documentos de texto en vectores de características usando tf-idf, y luego entrenar un algoritmo ingenuo de bayes para clasificarlos. Puedo cargar fácilmente mis archivos de texto sin las etiquetas y usar HashingTF () para ...
python textblob y clasificación de texto
Estoy tratando de construir un modelo de clasificación de texto con Python y textblob [https://textblob.readthedocs.org/en/dev/index.html], el script se está ejecutando en mi servidor y en el futuro la idea es que los usuarios puedan enviar su ...
Advertencia del usuario: etiqueta no: NÚMERO: está presente en todos los ejemplos de capacitación
Estoy haciendo una clasificación de múltiples etiquetas, donde trato de predecir las etiquetas correctas para cada documento y aquí está mi código: mlb = MultiLabelBinarizer() X = dataframe['body'].values y ...
¿Cómo asignar una nueva observación a los clústeres de Kmeans existentes basados en la lógica de centrípodos de clúster más cercana en Python?
Utilicé el siguiente código para crear clústeres de k-means utilizando Scikit learn. kmean = KMeans(n_clusters=nclusters,n_jobs=-1,random_state=2376,max_iter=1000,n_init=1000,algorithm='full',init='k-means++') kmean_fit = ...
Dimensión de forma en conv1D
He intentado construir una CNN con una capa, pero tengo algún problema. De hecho, el compilador me dice que ValueError: error al comprobar la entrada del modelo: se esperaba que conv1d_1_input tuviera 3 dimensiones, pero se obtuvo una matriz con ...
error de forma inconsistente MultiLabelBinarizer en y_test, sklearn clasificación multi-etiqueta
import numpy as np import pandas as pd from sklearn.pipeline import Pipeline from sklearn.feature_extraction.text import CountVectorizer from sklearn.svm import LinearSVC from sklearn.linear_model import SGDClassifier ...
Página 1 de 2