회귀 지표 (Regression Metrics)¶
개요¶
회귀(Regression) 모델은 연속 값을 예측하므로, 분류와는 다른 평가 체계가 필요하다. 예측값 \(\hat{y}_i\)와 실제값 \(y_i\) 사이의 차이(오차)를 어떻게 측정하느냐에 따라 모델의 성격이 달라진다.
이 문서에서는 MSE, RMSE, MAE, MAPE, \(R^2\) 등 핵심 회귀 지표의 정의, 특성, 그리고 상황별 선택 기준을 다룬다.
핵심 개념¶
Mean Squared Error (MSE, 평균제곱오차)¶
- 단위: 목표 변수의 제곱 단위 (예: 가격 예측이면 원\(^2\))
- 특성: 미분 가능(differentiable), 큰 오차에 이차적(quadratic) 페널티
- 통계적 의미: 가우시안 노이즈 가정 하에 최대우도추정(MLE)과 동일
- 최적 예측기: 조건부 평균 \(E[Y|X]\)
Root Mean Squared Error (RMSE, 평균제곱근오차)¶
- 단위: 목표 변수와 동일한 단위 → MSE보다 해석이 용이
- 특성: 여전히 큰 오차에 민감 (이상치 영향 큼)
- 실무에서 MSE보다 RMSE를 보고하는 경우가 많다
Mean Absolute Error (MAE, 평균절대오차)¶
- 단위: 목표 변수와 동일
- 특성: 이상치에 MSE/RMSE보다 강건(robust)
- 통계적 의미: 중앙값 회귀(Median regression), L1 손실과 대응
- 최적 예측기: 조건부 중앙값 \(\text{Median}(Y|X)\)
- 단점: 0에서 미분 불가능 (하지만 서브그래디언트 존재)
MSE vs MAE 트레이드오프¶
| 특성 | MSE / RMSE | MAE |
|---|---|---|
| 큰 오차에 대한 민감도 | 높음 (이차 페널티) | 낮음 (선형 페널티) |
| 이상치 강건성 | 약함 | 강함 |
| 최적 예측기 | 조건부 평균 | 조건부 중앙값 |
| 미분 가능성 | 어디서나 미분 가능 | 0에서 불가 |
| 오차 분포 가정 | 가우시안에 최적 | 라플라스에 최적 |
Huber Loss — 절충안:
작은 오차에서는 MSE처럼, 큰 오차에서는 MAE처럼 동작한다. \(\delta\)로 전환점을 조절한다.
Mean Absolute Percentage Error (MAPE, 평균절대백분율오차)¶
- 장점: 스케일 독립(scale-independent) — 서로 다른 규모의 목표를 비교할 수 있다
- 함정 1: \(y_i = 0\)이면 정의되지 않음 (0으로 나누기)
- 함정 2: 비대칭 — 과소예측(under-prediction)에 과대예측보다 더 큰 페널티
Symmetric MAPE (sMAPE) — 비대칭 문제 완화:
결정계수 (\(R^2\), R-Squared)¶
- 해석: 모델이 설명하는 분산의 비율
- \(R^2 = 1\): 완벽한 예측
- \(R^2 = 0\): 평균 예측과 동일한 성능
- \(R^2 < 0\): 평균 예측보다 나쁨 (매우 나쁜 모델)
- 범위: \((-\infty, 1]\)
함정: 특성(feature)을 추가하면 \(R^2\)는 항상 증가하거나 유지된다 — 무관한 특성을 추가해도 마찬가지. 이는 모델 선택에 \(R^2\)를 그대로 사용하면 안 되는 이유다.
수정 결정계수 (Adjusted \(R^2\))¶
- \(n\): 샘플 수, \(p\): 예측 변수의 수
- 무관한 특성 추가 시 감소할 수 있다 → 모델 복잡도에 대한 페널티 역할
- 서로 다른 수의 특성을 가진 모델 비교에 유용
- 자세한 모델 선택 기준은 모델 선택 기준 참조
Explained Variance Score (설명된 분산)¶
- \(R^2\)와의 차이: EV는 예측의 상수 편향(constant bias)에 둔감하다
- 항상 \(R^2 \leq \text{EV}\), 예측이 비편향(unbiased)일 때 등호 성립
기타 회귀 지표¶
| 지표 | 수식 | 특징 |
|---|---|---|
| Max Error | \(\max_i \|y_i - \hat{y}_i\|\) | 최악의 예측 분석 |
| Median Absolute Error | \(\text{median}(\|y_i - \hat{y}_i\|)\) | MAE보다 이상치에 더 강건 |
| MSLE | \(\frac{1}{n}\sum[\log(1+y_i) - \log(1+\hat{y}_i)]^2\) | 과소예측에 더 큰 페널티; 목표가 여러 자릿수에 걸칠 때 |
| Quantile Loss | \(L_q(y, \hat{y}) = q \cdot \max(y-\hat{y}, 0) + (1-q) \cdot \max(\hat{y}-y, 0)\) | 분위수 회귀용 |
상세 내용: 지표 종합 비교¶
| 지표 | 이상치 민감도 | 스케일 의존 | 해석 용이성 | 미분 가능 |
|---|---|---|---|---|
| MSE | 높음 | 예 (제곱 단위) | 낮음 | 예 |
| RMSE | 높음 | 예 (원래 단위) | 보통 | 예 |
| MAE | 보통 | 예 (원래 단위) | 높음 | 아니오 (0에서) |
| MAPE | 보통 | 아니오 (%) | 높음 | 아니오 |
| \(R^2\) | 높음 | 아니오 (무차원) | 높음 | 예 |
| Median AE | 낮음 | 예 (원래 단위) | 높음 | 아니오 |
언제 사용하는가¶
flowchart TD
A["회귀 지표 선택"] --> B{"이상치가 많은가?"}
B -->|"예"| C["MAE 또는 Median AE"]
B -->|"아니오"| D{"오차의 스케일 비교가<br/>필요한가?"}
D -->|"예 (다른 단위 비교)"| E["MAPE 또는 sMAPE"]
D -->|"아니오"| F{"큰 오차를 더 크게<br/>벌하고 싶은가?"}
F -->|"예"| G["MSE / RMSE"]
F -->|"아니오"| H["MAE"]
A --> I{"모델 간 설명력<br/>비교가 필요한가?"}
I -->|"예"| J["R² 또는 Adjusted R²"] 실전 가이드:
| 상황 | 추천 지표 | 이유 |
|---|---|---|
| 일반적인 회귀 벤치마크 | RMSE + \(R^2\) | 표준적, 해석 용이 |
| 이상치가 많은 데이터 | MAE 또는 Huber | 강건한 평가 |
| 다른 스케일의 목표 비교 | MAPE | 스케일 독립 |
| 부동산 가격 등 넓은 범위 | MSLE | 상대적 오차 중시 |
| 최악의 경우 분석 | Max Error | 안전 관련 응용 |
| 모델 복잡도 비교 | Adjusted \(R^2\) | 과적합 방지 |
흔한 오해와 함정¶
-
"\(R^2\)가 높으면 좋은 모델이다" — \(R^2\)는 특성 추가에 대해 단조 증가하므로, 과적합 모델도 높은 \(R^2\)를 가질 수 있다. Adjusted \(R^2\) 또는 교차 검증을 사용하라.
-
"RMSE와 MAE는 같은 순서를 준다" — 이상치 분포에 따라 모델 순위가 달라질 수 있다. 두 지표가 다른 모델을 선호하면, 데이터의 이상치 구조를 점검해야 한다.
-
"MAPE는 항상 스케일 독립적이다" — \(y_i\)가 0에 가까우면 MAPE가 폭발한다. 0이 포함될 수 있는 데이터에서는 sMAPE나 다른 지표를 고려하라.
-
"\(R^2\)는 항상 [0, 1]이다" — 아니다. \(R^2\)는 음수가 될 수 있다. 이는 모델이 단순 평균 예측보다 나쁘다는 의미다.
-
"MSE를 최소화하면 최선의 모델이다" — MSE는 이상치에 지나치게 민감할 수 있고, 실제 비즈니스 목적과 맞지 않을 수 있다. 지표 선택은 도메인에 따라 달라져야 한다.
다른 주제와의 연결¶
- 편향-분산 트레이드오프: MSE의 편향-분산 분해 — 회귀 오차의 근본 원인 분석
- 교차 검증: 회귀 지표를 신뢰할 수 있게 추정하는 방법
- 모델 선택 기준: AIC, BIC와 Adjusted \(R^2\)의 관계
- 보정 (Calibration): 확률적 회귀(probabilistic regression)에서의 보정