Resultados de la búsqueda a petición "dataframe"

7 la respuesta

Encuentre en qué fila de intervalo en un marco de datos pertenece cada elemento de un vector

Tengo un vector de elementos numéricos y un marco de datos con dos columnas que definen los puntos de inicio y final de los intervalos. Cada fila en el marco de datos es un intervalo. Quiero saber a qué intervalo pertenece cada elemento en el ...

1 la respuesta

pandas groupby cuenta la aparición de cadenas sobre la columna

Quiero contar la aparición de una cadena en una columna de marco de datos de pandas agrupadas. Supongamos que tengo el siguiente marco de datos: catA catB scores A X 6-4 RET A X 6-4 6-4 A Y 6-3 RET B Z 6-0 RET B Z 6-1 RET Primero, quiero ...

2 la respuesta

Spark Scala Dividir el marco de datos en el mismo número de filas

Tengo un Dataframe y deseo dividirlo en un número igual de filas. En otras palabras, quiero una lista de marcos de datos donde cada uno es un subconjunto desunido del marco de datos original. Digamos que el dataframer de entrada es el ...

1 la respuesta

El acceso a la columna con df [col] da: El error 'x' debe ser atómico para 'sort.list'

10 la respuesta

Método para crear la fecha de fin de mes a partir de la variable de fecha en el marco de datos [r]

Tengo un marco de datos grande [r] con variables de fecha, que reflejan el primer día del mes. ¿Es la manera fácil de crear una nueva variable de fecha de marco de datos que represente el último día del mes? Abajo hay algunos datos de ...

1 la respuesta

Crear / acceder a un marco de datos dentro de la transformación de otro marco de datos

Estoy adaptando un código existente para usar Spark. Tengo múltiples marcos de datos que contienen diferentes conjuntos de datos. Al transformar mi marco de datos principal (o mi conjunto de datos principal), necesito usar datos de los otros ...

4 la respuesta

devuelve el valor máximo del marco de datos de panda en su conjunto, no basado en columnas o filas

Estoy tratando de obtener el valor máximo de un marco de datos de panda en su conjunto. No me interesa de qué fila o columna proviene. Solo estoy interesado en un único valor máximo dentro del marco de datos. Aquí está mi marco de datos: df = ...

1 la respuesta

Salida de tabla formateada, impresión en consola R

Tengo una función que procesa algunos datos y me gustaría imprimir los pasos intermedios mientras continúa la función (un bucle). Podría hacer eso en 1 punto donde los datos actualizados están todos en unodata.frame(). Estoy pensando en una tabla ...

1 la respuesta

¿Cómo maneja Spark DataFrame el Pandas DataFrame que es más grande que la memoria?

Ahora estoy aprendiendo Spark, y parece ser la solución de Big Data para Pandas Dataframe, pero tengo esta pregunta que me hace inseguro. Actualmente estoy almacenando marcos de datos Pandas que son más grandes que la memoria usando HDF5. HDF5 ...

2 la respuesta

Transformando data.frame en R