[컴퓨터 비전과 딥러닝] P 376 中
검출(Detection) 분야에서는 mAP라는 성능 척도를 사용하는데, 이 성능 척도를 계산하기 위해서는
정밀도(Precision)과 재현율(Recall) 계산이 필요하다.
그러나 정밀도(Precision)과 재현율(Recall)에 대한 개념이 헷갈려 이와 같이 블로그에 정리를 해두려고 한다.
결론부터 말을 하면,
정밀도(Precision)은 모델[이] "Positive"라고 예측한 것이 얼마나 정확한 것인지를 계산한 것.
(정밀도 = TP/TP+FP)
재현율(Recall)은 실제로 "Positive"인 것들을 얼마나 모델이 잘 맞췄는 지를 계산한 것.
다시 말해, 모델이 얼마나 많은 "예"를 놓치지 않고 찾아냈는지를 나타냅니다.
(재현율 = TP/TP+FN)
정밀도(Precision)의 예를 들겠다.
예를 들어, 암 진단 모델의 정밀도가 0.8이라면, 모델이 암으로 예측한 환자 중 80%가 실제로 암인 것을 의미합니다.
이 말은 동시에, 모델이 환자 중 20%를 암 환자라고 오진을 했다는 뜻이 된다.
이번에는 재현율(Recall)의 예를 들겠다.
암 진단 모델의 재현율이 0.9이라면, 실제 암 환자 중 90%가 모델에 의해 정확하게 감지되었다는 것을 의미합니다.
이 말은 동시에, 모델이 실제 암 환자 중 10%를 오진했다는 뜻이다.
나는 항상 정밀도와 재현율의 상관 관계에 대해서 궁금하였다.
이것의 나의 Insight이기에 확실하다고 말은 할 수가 없지만, AUC 그래프를 보면 알듯이 모델의 성능을 측정할 때
정밀도와 재현율, 이 둘 중 하나만을 가지고 성능을 측정하기에는 한계가 존재하기에 보다 정확한 성능 지표를 산출하기 위
하여 항상 [정밀도, 재현율]이 한 SET처럼 묶여서 등장하는 것 같다.