본문 바로가기

통계30

[SAS] SAS를 이용해 두개의 데이터 비교후 큰 값과 그에 따르는 값들을 함께 출력하기 SAS를 이용해 두개의 데이터 비교후 큰 값과 그에 따르는 값들을 함께 출력하기 값을 가지는 두개의 변수를 비교해서 큰값과 그에 따르는 다른 변수들을 함께 출력하는 방법입니다. 위와 같이 가격을 비교해서 높은 값을 가지는 가격에 대한 품명과 종류를 함께 출력해봅시다. c변수와 c1을 비교하여 높은 값을 가지는 것을 선택하고 그에 따른 a,b 또는 a1,b1을 가격과 함께 출력하는 것입니다. 두 값 비교해서 큰 값 또는 작은 값을 출력하고 싶을 때 응용하여 사용할 수 있습니다. 김진휘 2013. 11. 14.
[SAS] SAS 그룹별로 가장 큰 값의 데이터만 출력하는 방법 SAS를 이용하여 그룹별로 가장 큰 값을 가진 데이터만 출력하는 방법입니다. 예제데이터로 해본다면 가게별로 가격이 가장 큰값을 가진 데이터만 출력해 보겠습니다. 이런 예제 및 코딩을 응용해 실무에서 그룹별 가장 큰 데이터를 추출할 때 요긴하게 사용될 것입니다. 데이터는 위와 같은 구조이며 결과는 위와 같이 각 그룹(가게)별 값(가격)이 가장 큰 데이터만 출력합니다. 위와 같이 따라하시면 결과가 나옵니다. 실무에서 그룹별 큰값을 추출하고 싶을때 응용해서 요긴하게 사용하시기 바랍니다. 김진휘 2013. 11. 14.
[Statistics, 통계] 연관성 분석, 척도 일반적으로 연구를 진행할 때, 한가지 변수로만 연구를 하는 경우는 거의 없다. 여러가지 변수를 가지고 연구를 하게 되는데, 여러가지 변수들 간에 어떠한 연관성을 가지고 있는지 확인하는 것이 중요하다. ⊙ 연관성 분석 : 변수들 간의 관계를 파악하는 분석 ⊙ 연관성 분석 방법 - 상관분석 : 변수가 등간 척도 / 비율 척도인 경우 - 교차분석 : 변수가 명목 척도 / 서열 척도인 경우 ☞ 척도는 무엇인가? ☞ 등간, 비율, 명목, 서열은 무엇인가? ⊙ 척도 : 사물이나 사람의 특성을 수량화 하기 위해 체계적인 단위로 숫자를 부여한 것 1. 양적 자료의 척도 ① 등간 척도 자료를 분류, 서열을 결정, 거리 or 간격 부여 - 양적인 차이 표시 가능 - 절대적 크기 나타내지 못함(비율의 계산 불가능) - 가감.. 2013. 10. 14.
[Statistics, 통계] 회귀분석 통계에서 가장 많이 쓰이고 불리는 회귀분석에 대해 간단하게 알아보도록 하자. 회귀(regression)는 무엇인가? 사전적 의미로는 한 바퀴 돌아 제자리로 돌아오거나 돌아감으로 정의 되고 있다. 회귀의 기원은 - 영국의 유전학자 Francis Galton(1822 ~ 1911)의 유전법칙 연구 중 나온 명칭 - 부모 키와 자녀 키 간의 직선관계를 발견 (아버지의 키가 아무리 크더라도 아들의 키는 아들 세대의 평균키로 접근하는 경향 발견) - Francis Galton은 이러한 현상을 평균으로의 회귀(regression toward mean)라고 함 그럼 회귀의 법칙을 활용한다면? 전체 평균값을 가지고 알지 못하는 누군가의 키를 예측해 볼 수 있다. 여자의 평균키가 160정도라고 한다면 친구를 통해 소개팅.. 2013. 10. 14.
[BIGDATA] 빅데이터의 정의(Value를 포함한 4V 측면) 지금은 빅데이터 세상 ! TV, 라디오, 인터넷, 신문, 잡지등 많이 듣고 볼 수 있는 것들이 빅데이터이다. 많은 사람들이 살아가면서 빅데이터들을 듣고, 접하지만 빅데이터에 관해 자세히 알지는 못한다. 이 글을 읽는 당신에게 질문하여 본다. 빅데이터가 무엇입니까? 대부분의 사람들은 큰 데이터? 대용량 데이터? 이런 식으로 답변들을 한다. 절대 틀린 이야기는 아니다. 하지만 부족함이 조금 느껴질 것이다. 빅데이터에 대해서 간단하고 쉽게 알아보자! 빅데이터(big data)를 한 줄로 요약해본다면? → 데이터의 생성 양과 주기 및 형식 등이 방대한 데이터 빅데이터(big data)에서 3V, 4V는 무엇인가? 빅데이터는 초대용량의 데이터 양(volume), 다양한 형태(variety), 빠른 생성 속도(ve.. 2013. 10. 14.
[My Story] 세상에서 가장 쉽게 빅데이터와 통계를 정복하는 블로그 개설! 빅데이터의 중요성을 매일 강조하는 이 세상 통계학문과 SAS 통계 패키지 프로그램들... 모두 어려워 하고 누구하나 초등학생들도 알아들을 만큼 쉽게 가르쳐 주는 사람이 없다. 무엇이 그리 어렵고, 진지하며 복잡한 것들인가? 결국 사람이 만들어내고, 이용하고, 말하는 것들 쉽게쉽게 빅데이터와 통계 그리고 SAS에 대해 함께 공부 해보자. 2013. 10. 14.