R - Распараллеливание обучения нескольких моделей (с dplyr и purrr)
Это продолжение допредыдущий вопрос об изучении нескольких моделей.
Случай использования состоит в том, что у меня есть несколько наблюдений для каждого предмета, и я хочу обучить модель для каждого из них. Смотри Хэдлиотличная презентация о том, как это сделать.
Короче говоря, это можно сделать с помощьюdplyr
а такжеpurrr
вот так:
library(purrr)
library(dplyr)
library(fitdistrplus)
dt %>%
split(dt$subject_id) %>%
map( ~ fitdist(.$observation, "norm"))
Так как построение модели - это смущающая параллельная задача, мне было интересно,dplyr
, purrr
иметь простой в использовании механизм распараллеливания для таких задач (например, параллельныйmap
).
Если эти библиотеки не обеспечивают легкого распараллеливания, можно ли это сделать с помощью классических библиотек распараллеливания R (parallel
, foreach
так далее)?