Resultados de la búsqueda a petición "partitioning"

7 la respuesta

LINQ Lista de particiones en listas de 8 miembros [duplicado]

Esta pregunta ya tiene una respuesta aquí: Split List en sublistas con LINQ [/questions/419019/split-list-into-sublists-with-linq] 27 respuestasCómo tomaría una Lista (usando LINQ) y la dividiría en una Lista de Listas que particiona la lista ...

1 la respuesta

Determinar el número óptimo de particiones Spark en función de los trabajadores, los núcleos y el tamaño del Marco de datos

Hay varios conceptos similares pero diferentes en Spark-land que rodean cómo el trabajo se cultiva en diferentes nodos y se ejecuta simultáneamente. Específicamente, hay: El nodo Spark Driver sparkDriverCount) El número de nodos de trabajo ...

5 la respuesta

Pandas: Muestreo de un marco de datos [duplicado]

Esta pregunta ya tiene una respuesta aquí: ¿Cómo dividir los datos en 3 conjuntos (tren, validación y prueba)? [/questions/38250710/how-to-split-data-into-3-sets-train-validation-and-test] 5 respuestas Estoy tratando de leer un archivo CSV ...

3 la respuesta

¿Cómo optimizar el particionamiento al migrar datos desde la fuente JDBC?

Estoy tratando de mover datos de una tabla en la tabla PostgreSQL a una tabla Hive en HDFS. Para hacer eso, se me ocurrió el siguiente código: val conf = ...

1 la respuesta

Particionar un gran conjunto de datos sesgados en S3 con el método de la partición de Spark

stoy tratando de escribir un gran conjunto de datos particionados en el disco con Spark y lapartitionByl algoritmo @ está luchando con los dos enfoques que he probado. Las particiones están muy sesgadas: algunas de las particiones son masivas ...

1 la respuesta

Kafka streams: Leer desde TODAS las particiones en cada instancia de una aplicación

Cuando se usa KTable, las transmisiones de Kafka no permiten que las instancias lean desde múltiples particiones de un tema en particular cuando la cantidad de instancias / consumidores es igual a la cantidad de particiones. Intenté lograr esto ...

1 la respuesta

¿Cómo puedo dividir / dividir una matriz por filas entre otras dos matrices?

Tengo una matriz y un vector cada uno con 3000 filas: fe = [-0.1850 -0.4485; ... -0.2150 2.6302; ... -0.2081 1.5883; ... -0.6416 -1.1924; ... -0.1188 1.3429; ... -0.2326 -2.2737; ... -0.0799 1.4821; ... ... %# lots more rows ]; tar = [1; ... 1; ...

13 la respuesta

Manera eficiente de dividir una lista en listas de n tamaño

Tengo un conjunto, que quiero dividir en conjuntos más pequeños de tamaño n, y realizar una operación en cada uno. Mi método actual para hacer esto es implementado con ArrayLists en Java (cualquier pseudocódigo servirá) for (int i = 1; i <= ...

4 la respuesta

¿Cuántas particiones de tabla son demasiadas en Postgres?

Estoy particionando una tabla muy grande que contiene datos temporales, y considerando qué granularidad debo hacer las particiones. Los Postgres documentación de partición [http://www.postgresql.org/docs/8.3/interactive/ddl-partitioning.html] ...

4 la respuesta

Partition Hive table por campo existente?

Puedo particionar una tabla de Hive al insertarla en un campo existente? Tengo un archivo de 10 GB con un campo de fecha y un campo de hora del día. ¿Puedo cargar este archivo en una tabla y luego insertar-sobrescribir en otra tabla ...