본문 바로가기

분류 전체보기163

[EXCEL] 엑셀2007 데이터분석-통계데이터분석 알아보기 엑셀(EXCEL)은 모두다 알다시피 가장 많이 사용하는 프로그램중 하나이다. 특히나 빅데이터의 시각화가 중요하다고 난리인 이때 간단하게 보기좋은 그래프들을 만들수 있기도 하다. 기존의 통계프로그램 예를 들어 SAS와 SPSS는 비용이 적지 않게 들고, R은 무료지만 기존 통계프로그램들은 하나의 언어라고 볼수 있기 때문에 활용하기가 처음 접하는 사람에게 매우 어렵다고 느껴질수가 있다. 엑셀로는 통계분석을 할 수 없을까? 엑셀로도 가능하다. 수천만건 수억건의 데이터 분석은 불가능하지만 간단한 데이터들 포함 왠만한 데이터들을 간단하게 통계분석을 할 수가 있다. 일반적으로 SAS나 SPSS 라이센스를 구입할만한 여력이 되지 않고, R프로그래밍을 다룰만한 인원이 없는 기업에서는 엑셀을 이용해서 간단하게 분석하기도.. 2014. 5. 8.
[SAS] sas에서 left join 왼쪽데이터셋 기준 가로병합하는 방법(교집합되는 부분가져오는 경우) sas에서 left join 왼쪽데이터셋 기준으로 가로병합하는 방법을 알아보자. 이경우는 공통된 교집합 부분을 포함하는 left join방법이다. 아래그림 참조 위의 그래프 그림과 같이 가로병합을 하되 hwi1(왼쪽데이터셋)기준으로 가로결합을 하며 공통된 부분은 같이 따라오게 하는 방법이다. 1. data step 먼저 sort과정을 거쳐 merge를 하는 data step에서 하는 방법을 알아보자. 가로 병합할 두개의 데이터셋의 키값(key)을 proc sort를 통해 정렬을 한다. 그리고 in이라는 데이터셋 옵션을 사용해서 if를 함께 이용해 in옵션에 임의의 변수명인 haha기준으로 merge를 하는 것이다. 아래 스크린샷 참조 2. proc sql 위와 같은 결과를 출력하는데 sort과정이 필요없.. 2014. 4. 29.
[EXCEL] 엑셀 공백 자동 채우기(대표값 데이터와 같게 모두 채우는 방법) 엑셀에서 각 값 사이에 공백이 있을 경우 해당하는 대표값과 같은 값으로 데이터를 채우고 싶은 경우가 있다. 몇 안되는 것은 마우스로 자동채우기를 사용하거나 그냥 입력하면 되지만 이것들이 수천건에서 수만건 정도의 빅데이터일 경우에는 손으로 일일이 한다는 것은 거의 불가능 하다. 한번에 공백을 대표값으로 채우는 방법을 알아보자. 자세한 사항은 사진참조 1. 아래와 같은 데이터가 있는데 ID변수에 공백부분을 각 대표값들로 채우고 싶다. 2. 먼저 채우고 싶은 범위를 드래그 한다. 아래 예제에서는 A2부터 A15까지임. 3. 범위를 지정한 뒤 F5를 누르면 아래와 같이 이동이라는 창이 나타난다. 이동창의 좌측아래에 옵션을 클릭한다. 4. 종류에서 왼쪽 아래에서 위로 4번째인 빈 셀을 체크한뒤 확인을 누른다. 5.. 2014. 4. 28.
[BIGDATA] 빅데이터 구글 검색 방법 10가지 팁(google 검색 방법) 빅데이터(bigdata) 시대에 우리는 수많은 정보를 간단한 검색으로 찾아 볼수가 있다. 국내에서 가장 많이 사용하는 것이 네이버(naver)이고, 통계나 프로그래밍쪽은 다음(daum) 검색엔진을 많이 사용할 것이다. 하지만 전세계적으로 많이 사용하는 검색엔진은 구글(google)인데, 국내 이용자들은 구글을 어려워 하고 있다. 더 많은 정보를 간단한 팁을 포함한 검색어로 구글에서 정확한 정보를 찾는 방법들을 몇가지 알아보도록 하자. 1. 특정 단어와 문장이 꼭 들어가야 할 경우 - 큰 따옴표("")를 입력하면 반드시 포함된 결과만 검색된다. ex) "sasbigdata" 로 검색하면 sasbigdata라는 문구가 포함된 것만 검색된다. 2. 특정 단어는 제외하고 싶은 경우 - 단어1 한칸띄우고(spac.. 2014. 4. 28.
[EXCEL] 엑셀 문서 암호화 설정 방법(보안설정) 엑셀2007 문서에 비밀번호를 설정하는 방법을 알아보자. excel 문서 암호화 설정 방법은 알면 아주 간단한데 의외로 모르는 사람들이 많다. 모든 기업에서 보안철저 정보 유출 방지 등을 외치는 이시대에 엑셀 문서 보안 설정 방법 정도는 알아두도록 하자. 아래 사진 참조. 1. 아래 화살표로 표시한 오피스단추를 클릭한다. 2. 그럼 아래와 같은 목록이 나타나는데 준비를 클릭하고 우측 목록이 나타나면 문서 암호화를 클릭한다. 3. 비밀번호를 입력하라는 문서 암호화 창이 나타난다. 내가 이 엑셀 문서에 지정하고 싶은 비밀번호를 입력하는 공간이다. 비밀번호를 입력하고 확인을 누른다. 4. 비밀번호 확인을 위해 한번더 똑같이 입력하라는 창이 나타난다. 앞에서 입력한 비밀번호를 다시 한번 입력한다. 그리고 확인을.. 2014. 4. 25.
[EXCEL] 엑셀 데이터 유효성 검사로 목록 만들기(설문지작성 유용) 엑셀에서 간단하게 데이터탭의 데이터 유효성 검사를 가지고 목록을 만드는 방법을 알아보자. 보통 설문지에 대한 답변등에 유용하게 쓰이는 방법인데 엑셀 문서를 만들때 쫌 더 깔끔하고 효율적으로 사용이 된다. 아래의 사진을 참조하여 예를 들어 알아보자. 아래처럼 설문지를 만들경우 문항에 비해 답변들의 다양성 떄문에 셀을 많이 잡아 먹는다. 이런 경우 좀더 깔끔하게 목록을 사용하여 선택 클릭 할 수 있게 만들어 보자. 아래 밑부분 표처럼 답변 항목을 입력하지 않고 질문 한줄, 답변 한줄로만 만들어 논 뒤 답변에 셀을 지정한다. 그리고 데이터-데이터 유효성 검사를 클릭한다. 아래와 같은 데이터 유효성 창이 나타나는데 제한 대상에서 목록을 클릭한다. 제한 대상을 목록으로 지정하면 아래에 원본이라는 항에 답변 항목을.. 2014. 4. 25.
[EXCEL] 엑셀에서 행과 열 바꾸는 방법 [EXCEL] 엑셀에서 행과 열 바꾸는 방법을 알아보자. 열심히 표를 만들어 놨는데 갑자기 행과 열을 바꿔야 한다고 하면? 다시 만들어야 되는가? 노노 간단하게 해결한다. SAS에서는 TRANSPOSE를 이용하기도 하지만 여기는 엑셀. 엑셀은 더 간단하게 할 수 있다. 1. 아래와 같이 표가 있는데 행과 열을 바꾸어야 한다고 가정하자. 먼저 행열을 바꾸고 싶은 데이터를 ctrl+c 또는 드래그와 우측 클릭으로 복사를 한다. 2. 아래사진처럼 출력을 원하는 곳에 커서를 두고 마우스 우측버튼 클릭 후 선택하여 붙여넣기를 클릭한다. 3. 아래와 같이 선택하여 붙여넣기 창이 나타나는데 화살표로 표시한 행/열 바꿈을 체크하고 확인을 누른다. 4. 아래의 결과를 보면 행과 열이 바뀐 것을 알 수가 있다. 5. 끝... 2014. 4. 25.
[SAS] sas에서 full join(합집합)에서 inner join(교집합)부분 빼는 방법(합집합-교집합) sas를 이용해 merge를 하는데 조건이 두개의 데이터셋 합집합 개념에서 교집합 부분을 빼는 방법을 알아보자. 아래의 그림을 보면 이해가 쉬울 것이다. 한마디로 hwi1 데이터셋과 hwi2 데이터셋의 초록색 부분을 추출해 내는 것이다. 1. DATA STEP 먼저 기본적인 데이터스텝에서 해보자. 두개의 데이터셋에서 기준이 되는 변수를 각각 proc sort를 이용해 정렬을 한다. 그뒤 아래의 그림에 코딩과정 처럼 진행하면 추출이 가능한데 if문에 있는 =^은 같지 않다라는 뜻이다. =^ 자리에 ne를 써도 같은 의미이다. ne는 not equal의 줄임말이다. 2. proc sql 위와 같은 결과값을 추출하지만 sort과정이 필요없기때문에 처리 속도가 빠른 sql문을 이용해 추출해보자. 아래 그림을 참.. 2014. 4. 25.
[EXCEL] 엑셀 데이터분석 추가하는 방법 마이크로소프트 오피스 엑셀 2007 (Microsoft office Excel) 이하 엑셀(EXCEL)에서 데이터분석을 추가하는 방법을 알아보도록 하자. 데이터 분석은 엑셀을 이용하여 각종 통계적수치등을 구할 수 있는 도구 인데 보통 처음 설치를 하면 대부분 추가가 되어 있지 않다. 1. 데이터 탭에 데이터 분석이 있으면 상관없지만 없는 경우라고 가정을 하고 해보자. 아래 화살표에 데이터 분석이 없다면? 2. 동그란 표시부분을 클릭한다. 3. 그럼 아래와 같이 창이 열리는데 Excel 옵션을 클릭한다. 4. 왼쪽의 추가 기능을 클릭한 뒤, 가운데 아래부분 화살표로 표시해논 이동을 클릭한다. 5. 아래와 같은 창이 열리는데 분석 도구와 분석 도구-VBA 체크한 뒤 확인을 누르면 데이터 분석이 추가가 된다... 2014. 4. 24.
[SAS] sas에서 full join 하기 (합집합 개념) sas에서 두개의 데이터셋을 full join하는 방법에 대해서 알아보자.(합집합 개념) 합집합에서는 좌 우측 데이터들의 일치 유무를 따지지 않고 모두 붙이는 개념인데 합치는 과정중 공백이 있다면 null값으로 처리한다. 위의 그림처럼 hwi1이라는 데이터 셋과 hwi2 데이터 셋의 합집합개념(초록색 부분)이라고 보면 된다. 1. data step 위의 사진은 data step을 사용하는 방법이다. proc sort과정을 하여 단순하게 merge시키면 위와 같이 원하는 합집합 개념의 결과가 도출된다. 2. proc sql(full join 사용) proc sql에서 full join명령어를 사용하는 방법이다. 자세히 보면 key변수의 555값이 없는 것을 볼 수 있다. 이것은 full join이 될때 기.. 2014. 4. 16.
[SAS] sas에서 inner join 하기 (교집합 개념) SAS에서 두개의 데이터셋을 합치는데 공통된 부분을 가로결합하는 방법을 알아보자. 쉽게 말하면 아래의 그림과 같이 초록색 부분인 교집합 부분을 출력하는 것이다. 위의 사진은 예제 데이터인 hwi1데이터셋과 hwi2데이터셋의 교집합 부분(초록색)을 출력하겠다는 그림이다. 1. data step 빅데이터에서는 proc sort과정의 처리속도 문제로 sql을 많이 사용하지만 일반적으로 많이 사용하는 데이터스텝에서 inner join(교집합)을 하는 과정을 알아보자. key값이 같은 데이터를 출력한다. join할 2개의 데이터셋의 기준이 되는 변수 key변수를 먼저 proc sort로 정렬을 한뒤 merge(가로병합)를 한다. 조건은 key기준으로 in의 a와 b가 같은 경우 교집한인 경우를 설정하면 위와 같이.. 2014. 4. 16.
[EXCEL] 엑셀에서 빈칸 공백 모두 한번에 선택하는 방법 엑셀(EXCEL)에서 빈칸 공백을 모두 한번에 선택하는 방법에 대해서 알아보자. 거기에 응용하여 왼쪽으로 데이터들을 한번에 붙이는 방법까지 알아보도록 하자. [사진순서대로 참조] 위와 같이 데이터들이 다 띄워져 있다. 이 데이터들 사이에 있는 공백들을 모두 선택하고 공백 빈칸을 모두 지워보도록 하는 작업을 해보자. 먼저 지우고 싶은 공백란의 범위를 지정한다. 공백의 범위를 지정한 뒤 CTRL+G 를 동시에 누르면 위와 같이 이동이라는 창이 나타난다. 이동 창의 좌측 아래에 있는 옵션을 클릭한다. 위와 같이 옵션항목들이 나타나게 되는데 사진과 같이 빈 셀을 클릭하고 확인을 누른다. 그럼 위의 사진과 같이 지정한 범위내의 모든 공백란이 선택이 된다. 여기서 추가적으로 응용하여 빈공간을 모두 지워버리고 퍼져있.. 2014. 4. 15.