Resultados de la búsqueda a petición "scikit-learn"

4 la respuesta

¿Cómo ajustar los parámetros en Random Forest, usando Scikit Learn?

class sklearn.ensemble.RandomForestClassifier(n_estimators=10, criterion='gini', max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features='auto', max_leaf_nodes=None, bootstrap=True, oob_score=False, ...

5 la respuesta

Python sklearn-K significa cómo obtener los valores en el clúster

Estoy usando el paquete sklearn.cluster KMeans. Una vez que termine la agrupación, si necesito saber qué valores se agruparon, ¿cómo puedo hacerlo? Digamos que tenía 100 puntos de datos y KMeans me dio 5 clúster. Ahora quiero saber qué puntos de ...

2 la respuesta

¿Usa el mismo codificador de etiquetas para probar el conjunto de datos? o nuevo Label Encoder?

Soy totalmente novato en scikit-learn. Quiero saber si debo usar la misma instancia de Label Encoder que había usado en el conjunto de datos de entrenamiento o no cuando quiero convertir los datos categóricos de la misma característica en el ...

1 la respuesta

Es scikit-learn adecuado para tareas de big data?

Estoy trabajando en una tarea de TREC que implica el uso de técnicas de aprendizaje automático, donde el conjunto de datos consta de más de 5 terabytes de documentos web, de los cuales se planea extraer vectores de bolsa de palabras. ...

1 la respuesta

TypeError grid seach

Solía crear un bucle para encontrar los mejores parámetros para mi modelo que aumentaron mis errores en la codificación, así que decidí usarGridSearchCV. stoy tratando de encontrar los mejores parámetros para PCA para mi modelo (el único ...

1 la respuesta

Tell LabelEnocder para ignorar las nuevas etiquetas?

Estoy trabajando con datos de texto en los que se deben tener en cuenta muchos errores de usuario, por ejemplo. Hay muchos casos en los que al predecir nuevos datos, aparecerán nuevas etiquetas que el codificador no ha visto antes debido ...

1 la respuesta

Utilizando Smote con Gridsearchcv en Scikit-learn

Estoy tratando con un conjunto de datos desequilibrado y quiero hacer una búsqueda en la cuadrícula para ajustar los parámetros de mi modelo usando gridsearchcv de scikit. Para sobremuestrear los datos, quiero usar SMOTE, y sé que puedo incluir ...

1 la respuesta

Cómo aplicar LabelEncoder para una columna específica en el marco de datos de Pandas

Tengo un conjunto de datos cargado por dataframe donde la etiqueta de clase debe codificarse usandoLabelEncoder de scikit-learn. La columnalabel es la columna de etiqueta de clase que tiene las siguientes clases: [‘Standing’, ‘Walking’, ...

1 la respuesta

¿Cómo lidiar con la imputación y la codificación hot one en pandas?

Estoy tratando de aplicar tanto la imputación como la codificación hot one en mi conjunto de datos. Sé que al aplicar la imputación, la dimensión de los datos puede cambiar y, por lo tanto, me ocupé de ello manualmente. El modelo funcionaba ...

1 la respuesta

Cómo normalizar los datos de Tren y Prueba usando MinMaxScaler sklearn

Entonces, tengo esta duda y he estado buscando respuestas. Entonces la pregunta es cuando uso, from sklearn import preprocessing min_max_scaler = preprocessing.MinMaxScaler() df ...