Resultados de la búsqueda a petición "data-science"

1 la respuesta

ValueError: número incorrecto de elementos aprobados - ¿Significado y sugerencias?

Estoy recibiendo el error:ValueError: Wrong number of items passed 3, placement implies 1, y estoy luchando por averiguar dónde y cómo puedo comenzar a abordar el problema. Realmente no entiendo el significado del error; lo que me dificulta la ...

2 la respuesta

La mejor manera de configurar un marco de datos de pandas [cerrado]

Hola, soy nuevo en Pandas y acabo de encontrarmedf.query(). Por qué la gente usaríadf.query() ¿Cuándo puede filtrar directamente sus Dataframes utilizando la notación de corchetes? El tutorial oficial de pandas también parece preferir el último ...

1 la respuesta

sklearn partial_fit () no muestra resultados precisos como fit ()

Estoy entrenando 3 listas de datos L1, L2, L3. Primero los entreno a todos con SGDClassifier fit () y luego instancia por instancia con partial_fit (). Yo pruebo los datos con L4, L5. [Los datos en las listas son datos de imagen y las imágenes ...

1 la respuesta

Configuración específica del servidor postgresql para fines de análisis de datos

¿Hay algún consejo sobre cómo ajustar el rendimiento del servidor usando el archivo postgresql.conf en caso de que use una base de datos postgresqlespecíficament para el departamento de ciencia de datos y para el análisis de datos? ¿O el ajuste ...

1 la respuesta

¿Cómo configuro los valores para el eje x en matplot en python?

plt.figure(figsize=(15,5)) plt.plot(data['Unemployment Rate']) plt.axis([1948,2017,0,15]) plt.show()Este código devolvió un gráfico vacío. La tabla contiene 2 columnas, datos ['Año'] y datos ['Tasa de desempleo']. El año es entre 1948 y ...

1 la respuesta

pandas reset_index después de groupby.value_counts ()

Estoy tratando de agrupar por una columna y calcular el recuento de valores en otra columna. import pandas as pd dftest = pd.DataFrame({'A':[1,1,1,1,1,1,1,1,1,2,2,2,2,2], 'Amt':[20,20,20,30,30,30,30,40, 40,10, 10, 40,40,40]}) ...

2 la respuesta

¿Cómo saber qué modelo de Keras es mejor?

No entiendo qué precisión en la salida usar para comparar mis modelos de 2 Keras para ver cuál es mejor. ¿Utilizo el "acc" (de los datos de entrenamiento) o el "val acc" (de los datos de validación)? Hay diferentes accs y val accs para cada ...

1 la respuesta

GridSearchCV - XGBoost - Parada temprana

Estoy tratando de hacer una búsqueda hiperparemeter con el uso de GridSearchCV de scikit-learn en XGBoost. Durante la búsqueda en la cuadrícula, me gustaría que se detuviera antes, ya que reduce drásticamente el tiempo de búsqueda y (esperando) ...

5 la respuesta

normalización cuantil en el marco de datos de pandas

Simplemente hablando, ¿cómo aplicar la normalización cuantil en un gran marco de datos de Pandas (probablemente 2,000,000 filas) en Python? PD. Sé que hay un paquete llamado rpy2 que podría ejecutar R en el subproceso, usando normalización de ...

3 la respuesta

ValueError: debe pasar DataFrame solo con valores booleanos

Pregunta En este archivo de datos, Estados Unidos se divide en cuatro regiones utilizando la columna "REGIÓN". Cree una consulta que encuentre los condados que pertenecen a las regiones 1 o 2, cuyo nombre comienza con 'Washington' y cuyo ...