Регрессия для переменной Rate в R

Мне было поручено разработать регрессионную модель, учитывающую зачисление студентов в различные программы. Это очень хороший, чистый набор данных, в котором количество зачислений хорошо соответствует распределению Пуассона. Я подгоняю модель в R (используя GLM и Zero Inflated Poisson.) Полученные остатки казались разумными.

Тем не менее, мне было дано указание изменить количество учеников на «показатель», который рассчитывался как student / school_population (в каждой школе свое население.)) Теперь это больше не переменная подсчета, а пропорция между 0 и 1. Это считается «долей зачисления» в программу.

Этот «показатель» (студенты / население) больше не является пуассоновским, но, безусловно, также не является нормальным. Итак, я немного растерялся в отношении соответствующего распределения и последующей модели для его представления.

Логарифмическое нормальное распределение, кажется, хорошо вписывается в этот параметр скорости, однако у меня много значений 0, так что на самом деле оно не подходит.

Любые предложения о наилучшей форме распределения для этого нового параметра, и как смоделировать его в R?

Спасибо!

Ответы на вопрос(1)

Ваш ответ на вопрос