ROC

Co to jest ROC? – Definicja
ROC (Receiver Operating Characteristic) to krzywa stosowana w statystyce i uczeniu maszynowym w celu oceny jakości modeli klasyfikacji binarnej. Przedstawia ona zależność między czułością (sensitivity) a specyficznością (1-specificity) modelu. Na jej podstawie można określić, jak dokładnie model radzi sobie z różnicowaniem pomiędzy dwiema klasami. Kolejnym ważnym aspektem ROC jest możliwość oceny skuteczności klasyfikacji za pomocą pola powierzchni pod krzywą (AUC – Area Under Curve).
Jak interpretować krzywą ROC?
Krzywa ROC pomaga wizualizować kompromis między czułością a specyficznością modelu na różnych poziomach progów decyzyjnych. Punkt znajdujący się bliżej lewego górnego rogu wykresu oznacza lepszą wydajność klasyfikatora, wskazując na wyższą zdolność modelu do poprawnego rozróżniania klas. Wartość AUC, której maksymalną możliwą wartością jest 1, stanowi syntetyczną miarę jakości modelu. Jeśli AUC dla ROC wynosi 0,5, oznacza to, że model nie jest lepszy niż losowe zgadywanie.
Dlaczego krzywa ROC jest użyteczna?
ROC znajduje swoje zastosowanie przede wszystkim w porównywaniu różnych modeli klasyfikacji binarnej. Dzięki niej można łatwo ocenić, który model ma lepszą skuteczność w zależności od wybranych progów decyzyjnych. Ponadto krzywa ROC pozwala unikać skupiania się wyłącznie na jednej metryce, jak np. dokładność (accuracy), która może być myląca w przypadku niezbalansowanych zbiorów danych. Analiza ROC dostarcza bardziej kompleksowego obrazu działania modelu, uwzględniając różne aspekty jego wydajności.