본문 바로가기

r10

[R프로그램] R에서 조건에 따른 부분집합을 구하는 경우 R프로그램에서 조건에 따른 부분집합을 구하는 경우를 실습하여 보자. sas를 이용한다면 if group=2; 라는 조건문을 주어서 쉽게 구할수 있다. R프로그램에는 여러가지 함수들이 있는데 이 경우에 사용되는 것이 subset()이라는 함수이다. 아래의 그림을 참조하자. R-studio에서 실행한 결과이다. a라는 데이터프레임에서 group변수의 값이 2인 것에 대한 데이터만 추출하는데 이 경우에 결측값인 NA도 함께 제거하는 경우이다. 일반적으로 group변수의 값이 2인 것만 가져올 경우 프로그램 코딩에 따라 결측값인 NA값도 포함해서 들고오는 경우가 있는데 친구의 질문으로 한번 해보았다. subset이라는 함수를 알아두면 간단하지만 아주 유용하게 사용될 것이다. www.sasbigdata.com 2015. 8. 19.
[R프로그램] Rstudio에서 데이터를 CSV파일로 저장하고 출력하는 방법 R프로그램의 Rstudio에서 데이터를 저장하고 출력하는 방법에 대해서 알아보자. 가장 많이 사용되는 파일 형식인 CSV형식의 데이터를 가지고 예제를 통해 알아보도록 하자. SAS로 생각한다면 간단하게 데이터 내보내기와 데이터 가져오기를 한다고 생각하면 된다. 데이터를 CSV파일 형식으로 출력하고 저장하는 방법 1. csv파일 데이터 가져오기 함수형식 : read.csv("csv파일이 저장되어 있는 경로 및 파일이름") 위의 그림은 예제데이터를 가져온 것이다. c드라이브의 program files에 rstudio폴더에 있는 test.csv파일을 가져오라는 명령이다. 함수형식에 맞게 read.csv를 입력한뒤 괄호 안에 쌍따옴표("")안에 파일이 저장되어 있는 경로와 파일명 및 확장자를 입력해 주면 간단하.. 2014. 6. 5.
[R프로그램] Rstudio에서 데이터 병합 merge 하는 방법 데이터 핸들링을 하면서 가장 많이하는 작업중 하나가 데이터 병합이다. merge라고 하는데 R프로그램에서 Rstudio로 merge(가로병합)하는 방법을 알아보자. merge(dataframe1, dataframe2, by= "dataframe1과 2에 공통으로 존재하는 병합시 기준이 되는 변수명") 먼저 데이터프레임이 2개가 필요하므로 샘플데이터를 생성한다. 아래그림의 코딩 및 결과 참조 1. dataframe1 자리에 들어갈 jin이라는 데이터프레임을 아래와 같이 생성하였다. 2. dataframe2 자리에 들어갈 hwi라는 데이터프레임을 아래와 같이 생성하였다. 3.merge문장을 이용해 jin이라는 데이터프레임과 hwi라는 데이터프레임을 결합한다. by= 부분에는 두개의 데이터프레임에 공통으로 존.. 2014. 6. 3.
[R프로그램] subset(dataframe,select=열이름):데이터세트에서 조건에 맞는 내용 조회 방법 R프로그램(Rstudio)으로 데이터세트에서 조건에 맞는 내용을 조회하는 방법을 알아보자. SAS로 비교한다면 if문장과 비슷하다고 보면 된다. subset(dataframe,select=열이름) : 데이터세트에서 조건에 맞는 내용 조회 간단한 예제를 통해서 알아보자. 위의 그림은 Rstudio프로그램의 스크립트(Script)창에 명령어를 입력한 화면이다. subset을 사용하여 조건에 맞는 값들을 출력한다. 코딩설명 iris는 iris라는 데이터프레임을 사용하는 말이다. select= 부분은 iris의 Petal.Width와 Species 의 변수들을 결과를 출력한다는 내용이다. subset= 부분은 Petal.Width 변수의 값이 0.3 미만인 경우라는 조건을 입력한 것이다. [결과창] 위의 그림은.. 2014. 6. 3.
[R프로그램] rep함수 R프로그램의 rep함수에 대해서 알아보자. rep(반복할 값, 반복횟수) 로 나타낼수가 있다. 반복적인 값을 입력할 경우에 사용되며 더미(dummy) 변수로 값을 생성할 때 자주 사용된다. 위의 사진을 예를 들면 7이란 값을 10번 반복하겠다는 말이다. 결과를 봐도 7이라는 값이 10개가 생성됬음을 알 수 있다. rep의 times 옵션은 반복수를 말하는데 입력해도 되고 안해도 상관 없다. 문자형 데이터도 가능하다. jin이라는 문자를 3번 반복한다는 것인데 역시나 jin이라는 값이 3개가 생성이 되었다. each옵션은 간단하게 설명하자면 각각 반복해라는 옵션이다. 위의 사진을 예로 들면 0부터 2의 값을 각각 3번씩 반복하라는 의미이다. 결과도 마찬가지로 0을 3번, 1을 3번 2를 3번 각각 반복하여.. 2014. 4. 11.
[R프로그램] seq 함수 R프로그램의 seq함수에 대해서 알아보자. seq(from=시작, to=끝, by=간격) 이렇게 표현할 수가 있는데 시작부분과 끝부분을 정한뒤 간격을 입력해주면 그 조건에 맞게 값을 생성하는 것이다. 위의 사진을 보면 0을 시작으로 10까지 2간격으로 값을 생성한 것이다. from, to, by를 입력하지 않고 수치만 입력해도 무방하다. 위의 사진은 0을 시작으로 10까지 값의 길이?를 5개만 출력하라는 것이다. 시작과 끝의 값을 기준으로 간격이 일정한 값 5개를 생성하는 것이다. from과 to는 맨 위의 사진과 동일하게 입력하지 않아도 무방하지만 마지막 length는 입력해야한다. 이유는 미입력시 5를 by(간격)로 인식하여 결과값이 0, 5, 10으로 생성이 되기 때문이다. 위의 사진은 간단하게 수.. 2014. 4. 11.
[R프로그램] 수열 생성하는 방법 R프로그램을 이용하여 수열을 생성하는 방법을 알아보자. 수열은 설명하면 일정한 규칙으로 자연수를 정의역으로 하는 함수인데 이해하기 쉽게 규칙이 있으면 그 규칙에 맞게 일정하게 숫자가 늘어나거나 줄어드는 것으로 뭐 여러 등차, 등비, 조화수열 등으로 구분할 수 있다. 위의 사진을 보면 수열을 간단하게 생성해 본 사진이다. 1:7은 1부터 7까지 +1씩 증가한다는 말이다. 결과처럼 1, 2, 3, 4, 5, 6, 7 의 결과가 나옴을 알 수가 있다. 1:5의 값인 즉 1, 2, 3, 4, 5를 jin 이라는 변수로 할당을 하였다. 위의 사진은 이전과 반대인 높은 숫자부터 낮은 숫자 즉, 역으로 수열을 생성할때 사용한다. 방식은 같으며 높은 숫자부터 입력하면 된다.(위의 사진 참조) www.sasbigdata.. 2014. 4. 11.
[R프로그램] 변수와 벡터를 생성하는 방법 R프로그램에서 변수와 벡터를 생성하는 방법에 대해서 알아보자. [변수와 벡터생성] 생성할 변수명은 왼쪽에 입력한다. 아래의 사진과 같이 변수명을 입력한 뒤, ' 2014. 4. 10.
[R프로그램] R 스튜디오 구성화면에 대한 설명 R스튜디오를 실행하면 총 4개의 창이 뜬다. 처음보면 이것들이 뭘 의미하는 창들인지 이해가 되지 않기 때문에 간단하게 R스튜디오의 구성화면에 대해서 알아보자. [R스튜디오 구성화면] 위의 사진의 각각의 창에 번호대로 설명을 하겠다. 1. 스크립트 창 : R명령어를 입력하는 창. 2번의 콘솔창에 명령어를 입력도 가능하지만 재실행이 불가능하다. 그러므로 항상 스크립트 창에 입력해 명령어를 저장한다. 명령어 실행방법은 실행하려는 문장에 커서를 두고, ctrl(컨트롤키)+enter(엔터키)를 동시에 눌러주면 콘솔창에서 명령어가 실행된다. 2. 콘솔 창 : 1번의 스크립트 창에서 실행한 명령문이 실행되는 것을 보는 곳. 오류 발생시 sas의 로그창 개념처럼 콘솔창에 에러 메세지가 뜬다. 3. 워크스페이스 창 : .. 2014. 4. 8.
[R프로그램] Rstudio 알스튜디오 설치하는 방법 알아보기 R을 실행하면 너무 단순한 하나의 창으로 뭔가 허전한 감이 있을것이다. 그래프 출력창이라던지 R편집기등 창이 원할시 새로 뜨긴 하지만 뭔가 보기 불편한 감이 생길 수가 있다. 그래서 R에서 프로그래밍하고, 그래프등도 한눈에 보기 편하게 구성되어 있는것이 R studio이다. 왼쪽이 기존의 R창이고 오른쪽이 R studio창이다. 어떤 것이 더 편한지는 개인마다 다르지만 R studio는 여러개의 창으로 한눈에 보기 편하게 만들어놔서 보기 편하려고 했으나, 일부의 사람은 창들이 많아 복잡하다고 기존의 R을 선호하는 사람도 있다. 둘다 기능은 같으니 편한 것을 사용하면 된다. 간단히 설명하자면 R이 있는데 편집기나 실행창, 그래프창을 그냥 한눈에 보기 편하게 하고자 한 것이 R studio라고 생각하면 된다.. 2014. 1. 27.