Resultados de la búsqueda a petición "partitioning"
LINQ Lista de particiones en listas de 8 miembros [duplicado]
Esta pregunta ya tiene una respuesta aquí: Split List en sublistas con LINQ [/questions/419019/split-list-into-sublists-with-linq] 27 respuestasCómo tomaría una Lista (usando LINQ) y la dividiría en una Lista de Listas que particiona la lista ...
Determinar el número óptimo de particiones Spark en función de los trabajadores, los núcleos y el tamaño del Marco de datos
Hay varios conceptos similares pero diferentes en Spark-land que rodean cómo el trabajo se cultiva en diferentes nodos y se ejecuta simultáneamente. Específicamente, hay: El nodo Spark Driver sparkDriverCount) El número de nodos de trabajo ...
Pandas: Muestreo de un marco de datos [duplicado]
Esta pregunta ya tiene una respuesta aquí: ¿Cómo dividir los datos en 3 conjuntos (tren, validación y prueba)? [/questions/38250710/how-to-split-data-into-3-sets-train-validation-and-test] 5 respuestas Estoy tratando de leer un archivo CSV ...
¿Cómo optimizar el particionamiento al migrar datos desde la fuente JDBC?
Estoy tratando de mover datos de una tabla en la tabla PostgreSQL a una tabla Hive en HDFS. Para hacer eso, se me ocurrió el siguiente código: val conf = ...
Particionar un gran conjunto de datos sesgados en S3 con el método de la partición de Spark
stoy tratando de escribir un gran conjunto de datos particionados en el disco con Spark y lapartitionByl algoritmo @ está luchando con los dos enfoques que he probado. Las particiones están muy sesgadas: algunas de las particiones son masivas ...
Kafka streams: Leer desde TODAS las particiones en cada instancia de una aplicación
Cuando se usa KTable, las transmisiones de Kafka no permiten que las instancias lean desde múltiples particiones de un tema en particular cuando la cantidad de instancias / consumidores es igual a la cantidad de particiones. Intenté lograr esto ...
¿Cómo puedo dividir / dividir una matriz por filas entre otras dos matrices?
Tengo una matriz y un vector cada uno con 3000 filas: fe = [-0.1850 -0.4485; ... -0.2150 2.6302; ... -0.2081 1.5883; ... -0.6416 -1.1924; ... -0.1188 1.3429; ... -0.2326 -2.2737; ... -0.0799 1.4821; ... ... %# lots more rows ]; tar = [1; ... 1; ...
Manera eficiente de dividir una lista en listas de n tamaño
Tengo un conjunto, que quiero dividir en conjuntos más pequeños de tamaño n, y realizar una operación en cada uno. Mi método actual para hacer esto es implementado con ArrayLists en Java (cualquier pseudocódigo servirá) for (int i = 1; i <= ...
¿Cuántas particiones de tabla son demasiadas en Postgres?
Estoy particionando una tabla muy grande que contiene datos temporales, y considerando qué granularidad debo hacer las particiones. Los Postgres documentación de partición [http://www.postgresql.org/docs/8.3/interactive/ddl-partitioning.html] ...
Partition Hive table por campo existente?
Puedo particionar una tabla de Hive al insertarla en un campo existente? Tengo un archivo de 10 GB con un campo de fecha y un campo de hora del día. ¿Puedo cargar este archivo en una tabla y luego insertar-sobrescribir en otra tabla ...