funkcja cost w cv.glm biblioteki startowej w R

Question

May 28, 2013, 12:55 AM

funkcja cost w cv.glm biblioteki startowej w R

Próbuję użyć funkcji cv.glm crossvidation z biblioteki rozruchowej w R, aby określić liczbę błędnych klasyfikacji, gdy zastosowana zostanie regresja logistyczna glm.

Funkcja ma następujący podpis:

cv.glm(data, glmfit, cost, K)

z dwoma pierwszymi oznaczającymi dane i model, a K określa k-krotnie. Moim problemem jest parametr kosztu, który jest zdefiniowany jako:

koszt: funkcja dwóch argumentów wektorowych określających funkcję kosztu dla walidacji krzyżowej. Pierwszy argument dotyczący kosztu powinien odpowiadać obserwowanym odpowiedziom, a drugi argument powinien odpowiadać przewidywanym lub dopasowanym odpowiedziom z uogólnionego modelu liniowego. koszt musi zwracać nieujemną wartość skalarną. Domyślnie jest to funkcja błędu średniej kwadratu.

Sądzę, że dla klasyfikacji sensowne byłoby posiadanie funkcji, która zwraca współczynnik błędnej klasyfikacji:

nrow(subset(data, (predict >= 0.5  & data$response == "no") | 
                  (predict <  0.5  & data$response == "yes")))

co oczywiście nie jest nawet poprawne składniowo.

Niestety, moja ograniczona wiedza R pozwoliła mi marnować godziny i zastanawiałem się, czy ktoś może wskazać mi właściwy kierunek.

questionAnswers(3)

Popularne pytania

0 odpowiedzi

Używanie NSPredicate z danymi podstawowymi do głębokich relacji

0 odpowiedzi

Integracja edytora WYSIWYG z najlepszym tekstem na miejscu

0 odpowiedzi

Jak uruchomić Zaćmienie w trybie czystym? a co się stanie, jeśli to zrobimy?

0 odpowiedzi

Szukam zakresu Ninject, który zachowuje się jak InRequestScope

0 odpowiedzi

MySQL: Poszukaj tego samego ciągu w wielu kolumnach

Jesteś bardzo aktywny! To świetnie!

funkcja cost w cv.glm biblioteki startowej w R

questionAnswers(3)

yourAnswerToTheQuestion

Popularne pytania