- 보험길라잡이
- 응용통계학
보험길라잡이
-
-
[공지] 2장. 통계적 추론(Statistical Learning)이란 [Part2] ?
-
부동산 예측 전문가가 “작년 1월엔 집값이 50% 올랐고, 2월엔 15% 내렸고, … , 12월엔 10% 내렸으니 올해도 이에 맞게 투자하면 됩니다.” 라고 말하면 과연 신빙성이 있을까? 올해 가격 추세가 작년의 추세와 동일하게 움직인다는 보장은 거의 없다. 이처럼 구구절절하게 말하는 것 보다는 투자자에게 “작년은 평균적으로 10% 올랐으니, 올해도 비슷하게 오를 겁니다.” 라고 말하는 전문가가 더 신빙성이 있어 보일 것이다. 모델을 통한 예측도 앞선 경우와 같다. 과거 데이터의 모든 관측치들에 세세하게 신경을 쓰면 예측은 틀릴 가능성이 높다. 또한 이상점(Outliers)들이 데이터에 포함되어 있으면 예측을 방해할 수도 있다. 좋은 예측 모델은 간단 명료해야 한다. 그런 모델들은 현상들을 쉽게 설명하고 좋은 예측력을 갖는다. 우리가 이번에 배울 Test MSE를 통해 예측력이 좋은 모델이 무엇인지 알려줄 것이다.
-
-
-
1장. 통계적 추론(Statistical Learning)이란? [Part 1]
-
미국 자동차 보험에서는 차량의 색상까지도 고려하여 보험료를 책정한다. 일반적인 생각으로 자동차 색상이 화려할수록 눈에 띄어 사고가 덜 발생할 거 같다. 하지만 파랑색, 녹색 차량이 전체 자동차 사고 중 45%를 차지한다. 우리는 이러한 사실을 통계적인 추론 없이는 알 수 없다. 통계적 추론은 우리에게 주변에서 일어나는 상황에 대해 새로운 통찰력을 가져다주며, 미래에 대한 예측을 하는 데 도움을 주기도 한다. 예를 들어 보험회사가 건강보험 상품의 과거 보험금 지급액을 성별, 연령, 상해급수에 따라 나열하면 각 항목에 따른 보험금 지급액 패턴을 파악할 수 있다. 그 후 보험계약자 특성(성별,연령,상해급수)을 입력하면 이에 따른 보험금 지급액을 예측할 수 있게 해준다. 보통 이는 일반화선형모형(Generalized Linear Model)를 통해 구해진다. 일반화선형모형은 통계적 추론(Statistical Learning)에서 쓰이는 도구 중에 하나다. 이번 장에서는 통계적 추론에 대한 기본개념을 먼저 간단히 알아보도록 하겠다.
-