¿Cómo plot.lm () determina los valores atípicos para la trama residual vs ajustada?

¿Cómo plot.lm () determina qué puntos son valores atípicos (es decir, qué puntos etiquetar) para el gráfico residual frente al gráfico ajustado? Lo único que encontré en eldocumentación Es esto:

Detalles

sub.caption (por defecto, la llamada a la función) se muestra como un subtítulo (debajo del título del eje x) en cada gráfico cuando los gráficos están en páginas separadas, o como un subtítulo en el margen exterior (si lo hay) cuando hay varios gráficos por página.

La gráfica de 'Ubicación de escala', también llamada gráfica de 'Ubicación de propagación' o 'S-L', toma la raíz cuadrada de los residuos absolutos para disminuir la asimetría (sqrt (| E |)) es mucho menos sesgada que | E | para Gaussian zero-mean E).

La gráfica "S-L", Q-Q y el apalancamiento residual utilizan residuos estandarizados que tienen una varianza idéntica (según la hipótesis). Se dan como R [i] / (s * sqrt (1 - h.ii)) donde h.ii son las entradas diagonales de la matriz del sombrero, influencia () $ sombrero (ver también sombrero), y donde el Residual- El diagrama de apalancamiento utiliza los residuos de Pearson estandarizados (resids.glm (type = "pearson")) para R [i].

El gráfico de apalancamiento residual muestra contornos de igual distancia de Cook, para valores de cook.levels (por defecto 0.5 y 1) y omite casos con apalancamiento uno con una advertencia. Si los apalancamientos son constantes (como suele ser el caso en una situación de aov equilibrada), la gráfica utiliza combinaciones de nivel de factor en lugar de los apalancamientos para el eje x. (Los niveles de factores se ordenan por valor ajustado promedio).

En el diagrama de distancia de Cook vs. apalancamiento / (1-apalancamiento), los contornos de los residuos estandarizados que son de igual magnitud son líneas a través del origen. Las líneas de contorno están etiquetadas con las magnitudes.

Pero no dice nada acerca de cómo se generaron los residuos frente a la gráfica ajustada y cómo elige qué puntos etiquetar.

Actualizar: La respuesta de Zheyuan Li sugiere que la forma en que la trama residual vs ajustada etiqueta los puntos es, en realidad, simplemente mirando los 3 puntos con los residuos más grandes. Este es de hecho el caso. Se puede demostrar con el siguiente ejemplo "extremo".

x = c(1,2,3,4,5,6)
y = c(2,4,6,8,10,12)
foo = data.frame(x,y)
model = lm(y ~ x, data = foo)

Respuestas a la pregunta(1)

Su respuesta a la pregunta