인공지능&머신러닝

혼동행렬(Confusion matrix) / 정확도 / 정밀도 / 재현율 / F1-score

zzheng 2024. 6. 10. 16:06

혼동행렬(Confusion matrix)이란?

  • 혼동행렬 또는 오차행렬이라고 불림.
  • 분류 모델의 평가지표로 많이 사용함.
  • 예측값이 실제 관측값을 얼마나 정확히 예측했는지 보여주는 행렬.
  • 혼동 행렬에서는 정확도(Accuracy), 정밀도(Precision), 재현율(Recall) 등의 지표를 구할 수 있음

  • True Positive (TP): 실제 클래스가 양성이고, 모델이 양성으로 예측한 샘플 수
  • False Positive (FP): 실제 클래스가 음성이지만, 모델이 양성으로 예측한 샘플 수
  • False Negative (FN): 실제 클래스가 양성이지만, 모델이 음성으로 예측한 샘플 수
  • True Negative (TN): 실제 클래스가 음성이고, 모델이 음성으로 예측한 샘플 수

 

정확도(Accuracy)

  • 전체에서 TP와 TN이 차치하는 비율
  • 모델이 입력된 데이터에 대해 얼마나 정확하게 예측하는지를 나타냄

Accuracy  (TP+TN) / (TP+TN+FN+FP)

 

정밀도 (Precision)

  • 양성으로 예측한 경우(TP+FP) 중 실제 양성(TP)인 비율
  • 모델의 예측값이 얼마나 정확하게 예측됐는가를 나타내는 지표

Precision TP/(TP+FP)

 

재현율(Recall)

  • 실제 양성(TP+FN)중 양성을 양성이라고 맞춘 (TP)인 비율
  • 실제값 중에서 모델이 검출한 실제값의 비율을 나타내는 지표

RecallTP / (TP+FN)

 

F1-score

  • 정밀도와 재현율을 조화평균내서 하나의 수치로 나타낸 지표

F1-score = 2*재현율*정밀도/(재현율+정밀도)