Regresja dla zmiennej Rate w R

Miałem zadanie opracowania modelu regresji, który uwzględniałby rekrutację uczniów do różnych programów. Jest to bardzo ładny, czysty zestaw danych, w którym liczba rejestracji jest zgodna z rozkładem Poissona. Dopasowałem model w R (używając zarówno GLM, jak i Zero Inflated Poissona). Powstałe reszty wydawały się rozsądne.

Zostałem jednak poinstruowany, aby zmienić liczbę uczniów na „stawkę” obliczoną jako liczba studentów / populacja szkolna (każda szkoła ma własną populację.)) Obecnie nie jest to już zmienna liczebności, ale proporcja między 0 a 1 Jest to uważane za „proporcję rejestracji” w programie.

Ta „szybkość” (studenci / populacja) nie jest już Poissonem, ale z pewnością też nie jest normalna. Więc jestem trochę zagubiony co do odpowiedniej dystrybucji i kolejnego modelu do jej reprezentowania.

Wydaje się, że logiczny rozkład normalny dobrze pasuje do tego parametru szybkości, jednak mam wiele wartości 0, więc nie pasuje.

Wszelkie sugestie dotyczące najlepszej formy dystrybucji dla tego nowego parametru i jak go modelować w R?

Dzięki!

questionAnswers(1)

yourAnswerToTheQuestion