Почему не желательно получать статистическую сводную информацию для коэффициентов регрессии из модели glmnet?

У меня есть модель регрессии с бинарным результатом. Я установил модель с помощью glmnet и получил выбранные переменные и их коэффициенты.

Так как glmnet не делаетЧтобы вычислить значение переменной, я бы хотел передать точный вывод (выбранные переменные и их коэффициенты) в glm для получения информации (стандартные ошибки и т. д.).

Я искал документы, кажется, я могу использовать "метод» опция в GLM, чтобы указать пользовательскую функцию. Но я не смог этого сделать, может кто-нибудь помочь мне с этим?

 TongZZZ17 окт. 2012 г., 17:53
Я проверюкаретка», а также не могли бы вы помочь мне с некоторым источником о том, как использовать термин смещение в GLM?
 TongZZZ17 окт. 2012 г., 17:44
Я неСейчас у меня нет примера, но, чтобы немного упростить вопрос. Предположим, у меня есть вывод формулы из glmnet как y = 2.3 * x1 + 3.1 * x2 + 0.9 * x3. Как мне указать эту формуляру в glm, чтобы ею манипулировали?
 Ben Bolker17 окт. 2012 г., 18:17
увидеть?glm, Я действительно недумаюoffset будет работать на вас, хотя. Если вы даетевоспроизводимый пример, может быть, кто-то другой будет вмешиваться
 Ben Bolker17 окт. 2012 г., 17:49
тот'не воспроизводится, но это дает мне немного лучшую идею. Я думаю, что вы, возможно, не сможете делать то, что вы хотите: то есть вы можете передать полностью указанную модель в glm, указав ее в качестве смещенного члена, но яЯ не уверен, что он может вычислить значение переменной с этой отправной точки. Думали ли вы об использованииcaret пакет, который делает форму усадки путем усреднения по моделяма также предоставляет информацию о переменной важности?
 Ben Bolker17 окт. 2012 г., 17:39
воспроизводимый пример, пожалуйста?tinyurl.com/reproducible-000

Ответы на вопрос(2)

Решение Вопроса

иентов регрессии или других оценочных величин. В принципе, такие стандартные ошибки могут быть легко вычислены, например, используя начальную загрузку.

Тем не менее, этот пакет намеренно не предоставляет их. Причина этого заключается в том, что стандартные ошибки не очень значимы для сильно смещенных оценок, например, возникающих из-за штрафных методов оценки. Оштрафованная оценка - это процедура, которая уменьшает дисперсию оценок путем введения существенного смещения. Таким образом, смещение каждой оценки является основным компонентом его среднеквадратичной ошибки, тогда как ее дисперсия может вносить лишь небольшую часть.

К сожалению, в большинстве случаев применения регрессионного наказания невозможно получить достаточно точную оценку смещения. Любые расчеты на основе бутстрапа могут дать только оценку дисперсии оценок. Надежные оценки смещения доступны только при наличии надежных несмещенных оценок, что обычно не имеет место в ситуациях, когда используются штрафные оценки.

Поэтому сообщение о стандартной ошибке оштрафованной оценки рассказывает только часть истории. Это может создать ошибочное впечатление высокой точности, полностью игнорируя неточность, вызванную смещением. Безусловно, ошибочно делать заявления о достоверности, которые основаны только на оценке дисперсии оценок, как это делают доверительные интервалы на основе бутстрапа ».

Джелле Гоман, доктор философии Лейденский университет, автор пакета наказаний в R.

 TongZZZ19 июл. 2013 г., 03:19
Очень хорошо объяснил, почему С.Е. не предоставляется!

HDI а такжеselectiveInference которые делают вывод для многомерных моделей, вы можете взглянуть на эти ... Я 'Мы также видели, как люди бегутglm используя предикторы, выбранныеglmnetно это неt принять во внимание неопределенность, вызванную процессом выбора самой лучшей модели ...

Ваш ответ на вопрос