본문 바로가기

proc surveyselect2

[SAS] SAS proc surveyselect를 이용한 층화랜덤추출방법(빅데이터,bigdata) 빅데이터(bigdata)에서 전수데이터를 사용하지 못해 대부분 표본데이터를 사용할 것이다. 이때 이용되는 표본추출방법 중 하나인 층화표본추출 층화랜덤추출방법이다. SAS에서 모집단으로 부터 표본을 추출할 때 어떤 변수에 대해 층화로 추출하는 방법을 알아보자. 표본을 추출할 때 proc surveyselect 를 사용하는데 층화랜덤추출을 하기 전에 층화할 변수에 대해서 먼저 proc sort 구문을 이용해 정렬을 한뒤에 추출을 해야한다. sex_tp_cd가 성별을 의미하는데 성별을 기준으로 정렬하여 성별 별로 10%추출을 한다. method=srs 는 추출방법을 SRS(단순무작위추출)로 추출하겠다는 것을 의미 rate=0.1 은 모집단 대비 10%를 추출하겠다는 의미 이외에도 스크린샷에는 없지만 자주 이용.. 2014. 2. 6.
[SAS] proc surveyselect (SAS, 모집단에서 단순무작위추출로 표본 추출하기) 실무에서 모집단 데이터에서 표본을 적게는 몇개부터 많게는 수만개까지 데이터를 추출해 달라는 요구가 많다. sas공부를 하면서도 아~ 간단하게 모집단에서 몇개만 랜덤으로 추출하고 싶은데 sas에서 어떡하지? 라는 경우도 생기며, 난수를 생성해서 해야하나? 등 복잡해지기 마련이다. 하지만 간단하게 코딩 몇줄로 이런 경우를 해결하는 방법이 있다. 바로 그것은! proc surveyselect 복잡한 샘플링 방법을 sas 코딩 한 두줄로 끝내버리는 것이다. 예를 들어보자 기존 데이터(a)가 10000건인데 그중에서 1000건만 추출해서 분석을 하고 싶다. 1000건을 무작위 또는 여러 방법으로 추출하고 싶은데 어떻게 해야하나? 단순무작위 추출을 사용할 경우 proc surveyselect data=a metho.. 2013. 10. 14.