Statystyki podsumowujące według dwóch lub więcej zmiennych czynników?
Najlepiej ilustruje to przykład
<code>str(mtcars) mtcars$gear <- factor(mtcars$gear, labels=c("three","four","five")) mtcars$cyl <- factor(mtcars$cyl, labels=c("four","six","eight")) mtcars$am <- factor(mtcars$am, labels=c("manual","auto") str(mtcars) tapply(mtcars$mpg, mtcars$gear, sum) </code>
To daje mi sumę mpg na bieg. Ale powiedzmy, że chciałbym mieć stół 3x3 z przekładnią na górze i przechylić się w bok, a 9 komórek z sumami dwuwymiarowymi, jak bym to zrobił „mądrze”.
Mógłbym pójść.
<code>tapply(mtcars$mpg[mtcars$cyl=="four"], mtcars$gear[mtcars$cyl=="four"], sum) tapply(mtcars$mpg[mtcars$cyl=="six"], mtcars$gear[mtcars$cyl=="six"], sum) tapply(mtcars$mpg[mtcars$cyl=="eight"], mtcars$gear[mtcars$cyl=="eight"], sum) </code>
To wydaje się kłopotliwe.
W jaki sposób miałbym przynieść trzecią zmienną w miksie?
To trochę w przestrzeni, o której myślę.Statystyki podsumowujące za pomocą ddply
aktualizacja To mnie tam prowadzi, ale to nie jest ładne.
<code>aggregate(mpg ~ am+cyl+gear, mtcars,sum) </code>
Twoje zdrowie