Resultados de la búsqueda a petición "data-science"

3 la respuesta

La forma más sencilla de convertir una lista con varios vectores de longitud en un marco de datos en R

Aquí tengo una lista con diferentes vectores de longitud. Y me gustaría obtener un data.frame. He visto muchas publicaciones al respecto en SO (ver ref.), Pero ninguna de ellas es tan simple como esperaba porque esta es realmente una tarea común ...

2 la respuesta

¿Cómo saber qué modelo de Keras es mejor?

No entiendo qué precisión en la salida usar para comparar mis modelos de 2 Keras para ver cuál es mejor. ¿Utilizo el "acc" (de los datos de entrenamiento) o el "val acc" (de los datos de validación)? Hay diferentes accs y val accs para cada ...

6 la respuesta

¿Dónde llamo a la función BatchNormalization en Keras?

Si quiero usar la función BatchNormalization en Keras, ¿debo llamarla solo una vez al principio? Leí esta documentación para ello:http://keras.io/layers/normalization/ [http://keras.io/layers/normalization/] No veo dónde se supone que debo ...

1 la respuesta

Spark MLib Decision Trees: ¿Probabilidad de etiquetas por características?

Podría lograr mostrar las probabilidades totales de milabels, por ejemplo, después de mostrar mi árbol de decisión, tengo una tabla: Total Predictions : 65% impressions 30% clicks 5% conversionsPero mi problema es encontrar probabilidades (o ...

5 la respuesta

normalización cuantil en el marco de datos de pandas

Simplemente hablando, ¿cómo aplicar la normalización cuantil en un gran marco de datos de Pandas (probablemente 2,000,000 filas) en Python? PD. Sé que hay un paquete llamado rpy2 que podría ejecutar R en el subproceso, usando normalización de ...

1 la respuesta

pandas reset_index después de groupby.value_counts ()

Estoy tratando de agrupar por una columna y calcular el recuento de valores en otra columna. import pandas as pd dftest = pd.DataFrame({'A':[1,1,1,1,1,1,1,1,1,2,2,2,2,2], 'Amt':[20,20,20,30,30,30,30,40, 40,10, 10, 40,40,40]}) ...

1 la respuesta

¿Cómo extraigo la fecha / año / mes del marco de datos de pandas?

Estoy tratando de extraer información de año / fecha / mes de la columna 'fecha' en el marco de datos de pandas. Aquí está mi código de muestra: from datetime import datetime def date_split(calendar): for row in calendar: new_calendar={} ...

3 la respuesta

ValueError: debe pasar DataFrame solo con valores booleanos

Pregunta En este archivo de datos, Estados Unidos se divide en cuatro regiones utilizando la columna "REGIÓN". Cree una consulta que encuentre los condados que pertenecen a las regiones 1 o 2, cuyo nombre comienza con 'Washington' y cuyo ...

1 la respuesta

¿Cómo optimizar el código MAPE en Python?

Necesito tener una función MAPE, sin embargo, no pude encontrarla en paquetes estándar ... A continuación, mi implementación de esta función. def mape(actual, predict): tmp, n = 0.0, 0 for i in range(0, len(actual)): if actual[i] <> 0: tmp += ...

1 la respuesta

GridSearchCV - XGBoost - Parada temprana

Estoy tratando de hacer una búsqueda hiperparemeter con el uso de GridSearchCV de scikit-learn en XGBoost. Durante la búsqueda en la cuadrícula, me gustaría que se detuviera antes, ya que reduce drásticamente el tiempo de búsqueda y (esperando) ...