Resultados de la búsqueda a petición "text-classification"

1 la respuesta

Scikit learn - fit_transform en el conjunto de prueba

Estoy luchando por usar Random Forest en Python con Scikit learn. Mi problema es que lo uso para la clasificación de texto (en 3 clases: positivo / negativo / neutro) y las características que extraigo son principalmente palabras / unigramas, por ...

1 la respuesta

¿Cómo clasificar las URL? ¿Cuáles son las características de las URL? Cómo seleccionar y extraer características de URL

Acabo de comenzar a trabajar en un problema de clasificación. Es un problema de dos clases, mi modelo entrenado (Machine Learning) tendrá que decidir / predecir si se debe permitir una URL o bloquearla. Mi pregunta es muy específica. ¿Cómo ...

1 la respuesta

CountVectorizer elimina características que solo aparecen una vez

Estoy usando el paquete sklearn python y tengo problemas para crear unCountVectorizer con un diccionario pre-creado, donde elCountVectorizer no elimina las funciones que solo aparecen una vez o que no aparecen en absoluto. Aquí está el código de ...

2 la respuesta

Probar el clasificador NLTK en un archivo específico

El siguiente código correNaive Bayes clasificador de revisión de películas. El código genera una lista de las características más informativas. Nota: **movie review** la carpeta está en elnltk. from itertools import chain from nltk.corpus ...

1 la respuesta

¿Cómo utilizar el clasificador de chispas Naive Bayes para la clasificación de texto con IDF?

Quiero convertir documentos de texto en vectores de características usando tf-idf, y luego entrenar un algoritmo ingenuo de bayes para clasificarlos. Puedo cargar fácilmente mis archivos de texto sin las etiquetas y usar HashingTF () para ...

1 la respuesta

python textblob y clasificación de texto

Estoy tratando de construir un modelo de clasificación de texto con Python y textblob [https://textblob.readthedocs.org/en/dev/index.html], el script se está ejecutando en mi servidor y en el futuro la idea es que los usuarios puedan enviar su ...

2 la respuesta

Advertencia del usuario: etiqueta no: NÚMERO: está presente en todos los ejemplos de capacitación

Estoy haciendo una clasificación de múltiples etiquetas, donde trato de predecir las etiquetas correctas para cada documento y aquí está mi código: mlb = MultiLabelBinarizer() X = dataframe['body'].values y ...

1 la respuesta

¿Cómo asignar una nueva observación a los clústeres de Kmeans existentes basados en la lógica de centrípodos de clúster más cercana en Python?

Utilicé el siguiente código para crear clústeres de k-means utilizando Scikit learn. kmean = KMeans(n_clusters=nclusters,n_jobs=-1,random_state=2376,max_iter=1000,n_init=1000,algorithm='full',init='k-means++') kmean_fit = ...

3 la respuesta

Dimensión de forma en conv1D

He intentado construir una CNN con una capa, pero tengo algún problema. De hecho, el compilador me dice que ValueError: error al comprobar la entrada del modelo: se esperaba que conv1d_1_input tuviera 3 dimensiones, pero se obtuvo una matriz con ...

1 la respuesta

error de forma inconsistente MultiLabelBinarizer en y_test, sklearn clasificación multi-etiqueta

import numpy as np import pandas as pd from sklearn.pipeline import Pipeline from sklearn.feature_extraction.text import CountVectorizer from sklearn.svm import LinearSVC from sklearn.linear_model import SGDClassifier ...