예를 들어 2, 5, 7, 8 처럼 양수값들이 n개가 있을 경우에
이 값들의 곱의 n제곱근을 기하평균(geometric mean)이라 한다.
sas에서 기하평균을 구하는 방법 참조
[기하평균의 공식]
실제로 공학용 계산기를 이용하여 2, 5, 7, 8에 대해서 기하평균을 구하여 보자.
값이 2, 5, 7, 8로 n의 갯수가 4이다. 기하평균값은 약 4.86이 나왔다.
[기하평균과 산술평균의 관계]
위의 공식을 보면 기하평균(geometric mean)은 산술평균(arithmetic mean)보다 크지 않음을 알 수가 있다.
위의 값으로 실제로 구해봐도
2, 5, 7, 8의 기하평균은 약 4.86 산술평균은 5.5로 기하평균은 산술평균보다 크지 않다.
[기하평균은 왜 쓸까?]
곱셈을 이용해서 계산하는 값에서 평균을 구할 때 산술평균이 아닌 기하평균을 사용한다.
데이터의 이상치 제거시에도 사용되기도 한다.
ex) 계산기의 값이 10000원 이였는데 다음 달에 20% 가격이 오르고 그 다음 달에 30% 가격이 오르고
그 다음달에 10% 가격이 떨어졌다. 위의 문제는 1.2, 1.3, 0.9 의 기하평균을 세번 곱한 값이 되는것이다.
기하평균이 약 1.12가 나온다는 것은 3개월동안 평균 약 12%씩 계산기의 가격이 증가 했다는 것이다.
위와 같이 표현하여 기하평균을 사용할 수 있다.
www.sasbigdata.com 김진휘
'Statistics' 카테고리의 다른 글
[Statistics, 통계] T-test(일표본, 이표본, 대응표본 t-test) (2) | 2014.02.10 |
---|---|
[Statistics, 통계] 자료의 종류(이산형 자료, 순서형 자료, 연속형 자료) (0) | 2013.11.28 |
[Statistics, 통계] 변수(variable) (0) | 2013.11.28 |
[Statistics, 통계] 통계적 자료분석 단계 (0) | 2013.11.27 |
[Statistics, 통계] 중심극한정리(Central Limit Theorem) (0) | 2013.11.25 |
댓글