SAS
[SAS] sas proc means를 이용해 그룹별 사분위수(q1, q3) 구하기. 이상치제거 응용가능
SASBIGDATA김진휘
2014. 2. 21. 13:52
sas의 proc means를 이용하여 그룹별로 사분위수를 구하는 방법을 알아보자.
이 방법은 표본층화추출방법을 사용했거나 기타등 데이터에서 사분위수 이상치제거 작업전에 q1, q3를 구하는데
많이 사용되는 방법이다.
먼저 이작업의 유의점은 이전과는 달리 그룹별로 먼저 proc sort를 이용하여 정렬을 해주어야 한다.
그룹별로 정렬작업을 하고 그 뒤는 이전과 같이 사진 처럼 proc means를 이용해 q1과 q3를 구하면 된다.
대신 var cost - cost라는 연속형 변수에 대해 q1과 q3를 구하는데 우리는 이번에는 그룹별로 구할 것이므로
그전에 by group 라는 문구를 입력해준다.
그럼 사진의 맨 아래부분과 같이 그룹 a와 b별로 각각의 q1과 q3를 구할수 있다.
_type_과 _freq_는 proc means를 사용하여 자동으로 생기는 변수들인데 보기 싫다면
drop또는 keep을 이용해 원하는 변수만 볼수 있다.