Resultados de la búsqueda a petición "scikit-learn"
¿Cómo ajustar los parámetros en Random Forest, usando Scikit Learn?
class sklearn.ensemble.RandomForestClassifier(n_estimators=10, criterion='gini', max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features='auto', max_leaf_nodes=None, bootstrap=True, oob_score=False, ...
Python sklearn-K significa cómo obtener los valores en el clúster
Estoy usando el paquete sklearn.cluster KMeans. Una vez que termine la agrupación, si necesito saber qué valores se agruparon, ¿cómo puedo hacerlo? Digamos que tenía 100 puntos de datos y KMeans me dio 5 clúster. Ahora quiero saber qué puntos de ...
¿Usa el mismo codificador de etiquetas para probar el conjunto de datos? o nuevo Label Encoder?
Soy totalmente novato en scikit-learn. Quiero saber si debo usar la misma instancia de Label Encoder que había usado en el conjunto de datos de entrenamiento o no cuando quiero convertir los datos categóricos de la misma característica en el ...
Es scikit-learn adecuado para tareas de big data?
Estoy trabajando en una tarea de TREC que implica el uso de técnicas de aprendizaje automático, donde el conjunto de datos consta de más de 5 terabytes de documentos web, de los cuales se planea extraer vectores de bolsa de palabras. ...
TypeError grid seach
Solía crear un bucle para encontrar los mejores parámetros para mi modelo que aumentaron mis errores en la codificación, así que decidí usarGridSearchCV. stoy tratando de encontrar los mejores parámetros para PCA para mi modelo (el único ...
Tell LabelEnocder para ignorar las nuevas etiquetas?
Estoy trabajando con datos de texto en los que se deben tener en cuenta muchos errores de usuario, por ejemplo. Hay muchos casos en los que al predecir nuevos datos, aparecerán nuevas etiquetas que el codificador no ha visto antes debido ...
Utilizando Smote con Gridsearchcv en Scikit-learn
Estoy tratando con un conjunto de datos desequilibrado y quiero hacer una búsqueda en la cuadrícula para ajustar los parámetros de mi modelo usando gridsearchcv de scikit. Para sobremuestrear los datos, quiero usar SMOTE, y sé que puedo incluir ...
Cómo aplicar LabelEncoder para una columna específica en el marco de datos de Pandas
Tengo un conjunto de datos cargado por dataframe donde la etiqueta de clase debe codificarse usandoLabelEncoder de scikit-learn. La columnalabel es la columna de etiqueta de clase que tiene las siguientes clases: [‘Standing’, ‘Walking’, ...
¿Cómo lidiar con la imputación y la codificación hot one en pandas?
Estoy tratando de aplicar tanto la imputación como la codificación hot one en mi conjunto de datos. Sé que al aplicar la imputación, la dimensión de los datos puede cambiar y, por lo tanto, me ocupé de ello manualmente. El modelo funcionaba ...
Cómo normalizar los datos de Tren y Prueba usando MinMaxScaler sklearn
Entonces, tengo esta duda y he estado buscando respuestas. Entonces la pregunta es cuando uso, from sklearn import preprocessing min_max_scaler = preprocessing.MinMaxScaler() df ...