Кто-нибудь знает, как генерировать AUC / Roc Area на основе предусловий?

Я знаю зону AUC / ROC (http://weka.wikispaces.com/Area+under+the+curve) в weka основан на статистике Манна Уитни (http://en.wikipedia.org/wiki/Mann-Whitney_U)

Но я сомневаюсь, что если у меня есть 10 помеченных экземпляров (Y или N, двоичный целевой атрибут), применив алгоритм (то есть J48) к набору данных, то в этих 10 экземплярах будет 10 предсказанных меток. Тогда что именно я должен использовать для вычисления AUC_Y, AUC_N и AUC_Avg? Используйте ранжированный ярлык прогноза Y и N или фактический ярлык (Y 'и N')? Или мне нужно рассчитать ставку TP и FP?

Может ли кто-нибудь дать мне небольшой пример и указать, какие данные я должен использовать для расчета AUC на основе статистического подхода Манна Уитни? Заранее спасибо.

Пример данных:

inst#    actual predicted  error   PrY     PrN
1        1:y        1:y          *0.973   0.027
2        1:y        1:y          *0.999   0.001
3        2:n        1:y      +   *0.568   0.432
4        2:n        2:n           0.382  *0.618
5        1:y        2:n      +    0.421  *0.579
6        2:n        2:n           0.146  *0.854
7        1:y        1:y          *1       0    
8        1:y        1:y          *0.999   0.001
9        2:n        2:n           0.11   *0.89 
10       1:y        2:n      +    0.377  *0.623

Ответы на вопрос(2)

Ваш ответ на вопрос