крупномасштабная регрессия в R с матрицей разреженных признаков
Я хотел бы сделать крупномасштабную регрессию (линейную / логистическую) в R со многими (например, 100 КБ) объектами, где каждый пример относительно редок в пространстве признаков - например, ~ 1 000 ненулевых объектов в примере.
Кажется, чтоSparseM пакетslm
должен сделать это, но у меня возникают трудности при конвертации изsparseMatrix
отформатировать вslm
формат
У меня есть числовой вектор метокy
иsparseMatrix
из особенностейX
\ in {0,1}. Когда я пытаюсь
model <- slm(y ~ X)
Я получаю следующую ошибку:
Error in model.frame.default(formula = y ~ X) :
invalid type (S4) for variable 'X'
вероятно потому чтоslm
хочетSparseM
объект вместоsparseMatrix
.
Есть ли простой способ а) заполнитьSparseM
объект напрямую или б) преобразоватьsparseMatrix
кSparseM
объект? Или, возможно, есть лучший / более простой способ сделать это?
(Я полагаю, я мог бы явно кодировать решения для линейной регрессии, используяX
а такжеy
, но было бы неплохо иметьslm
за работой.)