혼동행렬(Confusion matrix)이란?
- 혼동행렬 또는 오차행렬이라고 불림.
- 분류 모델의 평가지표로 많이 사용함.
- 예측값이 실제 관측값을 얼마나 정확히 예측했는지 보여주는 행렬.
- 혼동 행렬에서는 정확도(Accuracy), 정밀도(Precision), 재현율(Recall) 등의 지표를 구할 수 있음
- True Positive (TP): 실제 클래스가 양성이고, 모델이 양성으로 예측한 샘플 수
- False Positive (FP): 실제 클래스가 음성이지만, 모델이 양성으로 예측한 샘플 수
- False Negative (FN): 실제 클래스가 양성이지만, 모델이 음성으로 예측한 샘플 수
- True Negative (TN): 실제 클래스가 음성이고, 모델이 음성으로 예측한 샘플 수
정확도(Accuracy)
- 전체에서 TP와 TN이 차치하는 비율
- 모델이 입력된 데이터에 대해 얼마나 정확하게 예측하는지를 나타냄
Accuracy = (TP+TN) / (TP+TN+FN+FP)
정밀도 (Precision)
- 양성으로 예측한 경우(TP+FP) 중 실제 양성(TP)인 비율
- 모델의 예측값이 얼마나 정확하게 예측됐는가를 나타내는 지표
Precision = TP/(TP+FP)
재현율(Recall)
- 실제 양성(TP+FN)중 양성을 양성이라고 맞춘 (TP)인 비율
- 실제값 중에서 모델이 검출한 실제값의 비율을 나타내는 지표
Recall = TP / (TP+FN)
F1-score
- 정밀도와 재현율을 조화평균내서 하나의 수치로 나타낸 지표
F1-score = 2*재현율*정밀도/(재현율+정밀도)
'인공지능&머신러닝' 카테고리의 다른 글
[머신러닝]서포트벡터머신(SVM,Support Vector Machine)원리 및 코드 예시 (0) | 2024.06.24 |
---|---|
[머신러닝]K-최근접 이웃(KNN모델)원리 및 코드 예시 (0) | 2024.06.24 |
[데이터 전처리]데이터 스케일링(Data Scaling): (0) | 2024.06.24 |
[머신러닝]결정트리(Decision Tree)원리 및 코드 예시 (0) | 2024.06.24 |
[머신러닝]나이브 베이즈(Naive Bayes)원리와 코드 예시 (0) | 2024.06.24 |