본문 바로가기

sas 4분위수2

[SAS] sas proc means를 이용해 그룹별 사분위수(q1, q3) 구하기. 이상치제거 응용가능 sas의 proc means를 이용하여 그룹별로 사분위수를 구하는 방법을 알아보자. 이 방법은 표본층화추출방법을 사용했거나 기타등 데이터에서 사분위수 이상치제거 작업전에 q1, q3를 구하는데 많이 사용되는 방법이다. 먼저 이작업의 유의점은 이전과는 달리 그룹별로 먼저 proc sort를 이용하여 정렬을 해주어야 한다. 그룹별로 정렬작업을 하고 그 뒤는 이전과 같이 사진 처럼 proc means를 이용해 q1과 q3를 구하면 된다. 대신 var cost - cost라는 연속형 변수에 대해 q1과 q3를 구하는데 우리는 이번에는 그룹별로 구할 것이므로 그전에 by group 라는 문구를 입력해준다. 그럼 사진의 맨 아래부분과 같이 그룹 a와 b별로 각각의 q1과 q3를 구할수 있다. _type_과 _fre.. 2014. 2. 21.
[SAS] sas proc means를 이용해 사분위수(q1, q3) 구하기. 이상치제거 응용가능 sas에서 많이 사용되는 proc means를 이용해서 사분위수인 q1과 q3를 구해보자. 특이 이 작업은 이상치제거작업시 가장 흔하게 사용되는 사분위수 제거방법을 사용할때 자주 응용되는 방법이다. 정확하게는 1사분위수(q1), 3사분위수(q3)를 구하는 방법이다. 코드과정은 간단하다. proc means에서 알고싶은 연속형 변수를 입력한다,(var cost부분처럼) 그다음 q1=q1(ace1생성시 1사분위수 데이터의 지정하고싶은 변수명 아무것이나 가능),q3도 같다. 4분위수 q1, q3를 이용해 이상치를 제거 할때 위 사진 처럼 작업하여 q1, q3를 구하여 작업을 많이 한다. www.sasbigdata.com 김진휘 2014. 2. 21.