본문 바로가기

더미변수2

[R프로그램] rep함수 R프로그램의 rep함수에 대해서 알아보자. rep(반복할 값, 반복횟수) 로 나타낼수가 있다. 반복적인 값을 입력할 경우에 사용되며 더미(dummy) 변수로 값을 생성할 때 자주 사용된다. 위의 사진을 예를 들면 7이란 값을 10번 반복하겠다는 말이다. 결과를 봐도 7이라는 값이 10개가 생성됬음을 알 수 있다. rep의 times 옵션은 반복수를 말하는데 입력해도 되고 안해도 상관 없다. 문자형 데이터도 가능하다. jin이라는 문자를 3번 반복한다는 것인데 역시나 jin이라는 값이 3개가 생성이 되었다. each옵션은 간단하게 설명하자면 각각 반복해라는 옵션이다. 위의 사진을 예로 들면 0부터 2의 값을 각각 3번씩 반복하라는 의미이다. 결과도 마찬가지로 0을 3번, 1을 3번 2를 3번 각각 반복하여.. 2014. 4. 11.
[Statistics, 통계] 회귀분석 통계에서 가장 많이 쓰이고 불리는 회귀분석에 대해 간단하게 알아보도록 하자. 회귀(regression)는 무엇인가? 사전적 의미로는 한 바퀴 돌아 제자리로 돌아오거나 돌아감으로 정의 되고 있다. 회귀의 기원은 - 영국의 유전학자 Francis Galton(1822 ~ 1911)의 유전법칙 연구 중 나온 명칭 - 부모 키와 자녀 키 간의 직선관계를 발견 (아버지의 키가 아무리 크더라도 아들의 키는 아들 세대의 평균키로 접근하는 경향 발견) - Francis Galton은 이러한 현상을 평균으로의 회귀(regression toward mean)라고 함 그럼 회귀의 법칙을 활용한다면? 전체 평균값을 가지고 알지 못하는 누군가의 키를 예측해 볼 수 있다. 여자의 평균키가 160정도라고 한다면 친구를 통해 소개팅.. 2013. 10. 14.