Dlaczego lm zabrakło pamięci, a mnożenie macierzy działa dobrze dla współczynników?

Question

Apr 26, 2012, 05:33 AM

linear-regression lm memory regression r

Dlaczego lm zabrakło pamięci, a mnożenie macierzy działa dobrze dla współczynników?

Próbuję zrobić regresję liniową z ustalonymi efektami z R. Moje dane wyglądają

<code>dte   yr   id   v1   v2
  .    .    .    .    .
  .    .    .    .    .
  .    .    .    .    .
</code>

Zdecydowałem się po prostu to zrobićyr czynnik i wykorzystanielm:

<code>lm(v1 ~ factor(yr) + v2 - 1, data = df)
</code>

Jednak wydaje się, że zabrakło pamięci. Mam 20 poziomów w moim czynniku idf jest 14 milionów wierszy, których przechowywanie zajmuje około 2 GB, używam tego na komputerze z 22 GB przeznaczonym na ten proces.

Postanowiłem więc spróbować rzeczy w staromodny sposób: tworzyć fikcyjne zmienne dla każdego z moich latt1 dot20 wykonując:

<code>df$t1 <- 1*(df$yr==1)
df$t2 <- 1*(df$yr==2)
df$t3 <- 1*(df$yr==3)
...
</code>

i po prostu oblicz:

<code>solve(crossprod(x), crossprod(x,y))
</code>

To działa bez problemu i daje odpowiedź niemal natychmiast.

Jestem szczególnie ciekawy, co takiego jest w lm, co sprawia, że zabrakło mu pamięci, gdy mogę obliczyć współczynniki w porządku? Dzięki.

questionAnswers(5)

Popularne pytania

0 odpowiedzi

Połącz parametry lokalizacji i inicjalizacji jQuery-ui datepicker

0 odpowiedzi

Odpowiedź pętli JSON po sukcesie ajax

0 odpowiedzi

Jak mogę uzyskać aktualną zawartość elementu w webdriver

0 odpowiedzi

Przyczyna: android.os.NetworkOnMainThreadException [duplikat]

0 odpowiedzi

Jak importować lub włączać struktury danych (np. Dyktat) do pliku Pythona z oddzielnego pliku

Jesteś bardzo aktywny! To świetnie!

Dlaczego lm zabrakło pamięci, a mnożenie macierzy działa dobrze dla współczynników?

questionAnswers(5)

yourAnswerToTheQuestion

Popularne pytania