본문 바로가기

r프로그램7

[R프로그램] Rstudio에서 데이터를 CSV파일로 저장하고 출력하는 방법 R프로그램의 Rstudio에서 데이터를 저장하고 출력하는 방법에 대해서 알아보자. 가장 많이 사용되는 파일 형식인 CSV형식의 데이터를 가지고 예제를 통해 알아보도록 하자. SAS로 생각한다면 간단하게 데이터 내보내기와 데이터 가져오기를 한다고 생각하면 된다. 데이터를 CSV파일 형식으로 출력하고 저장하는 방법 1. csv파일 데이터 가져오기 함수형식 : read.csv("csv파일이 저장되어 있는 경로 및 파일이름") 위의 그림은 예제데이터를 가져온 것이다. c드라이브의 program files에 rstudio폴더에 있는 test.csv파일을 가져오라는 명령이다. 함수형식에 맞게 read.csv를 입력한뒤 괄호 안에 쌍따옴표("")안에 파일이 저장되어 있는 경로와 파일명 및 확장자를 입력해 주면 간단하.. 2014. 6. 5.
[R프로그램] Rstudio에서 데이터 병합 merge 하는 방법 데이터 핸들링을 하면서 가장 많이하는 작업중 하나가 데이터 병합이다. merge라고 하는데 R프로그램에서 Rstudio로 merge(가로병합)하는 방법을 알아보자. merge(dataframe1, dataframe2, by= "dataframe1과 2에 공통으로 존재하는 병합시 기준이 되는 변수명") 먼저 데이터프레임이 2개가 필요하므로 샘플데이터를 생성한다. 아래그림의 코딩 및 결과 참조 1. dataframe1 자리에 들어갈 jin이라는 데이터프레임을 아래와 같이 생성하였다. 2. dataframe2 자리에 들어갈 hwi라는 데이터프레임을 아래와 같이 생성하였다. 3.merge문장을 이용해 jin이라는 데이터프레임과 hwi라는 데이터프레임을 결합한다. by= 부분에는 두개의 데이터프레임에 공통으로 존.. 2014. 6. 3.
[R프로그램] subset(dataframe,select=열이름):데이터세트에서 조건에 맞는 내용 조회 방법 R프로그램(Rstudio)으로 데이터세트에서 조건에 맞는 내용을 조회하는 방법을 알아보자. SAS로 비교한다면 if문장과 비슷하다고 보면 된다. subset(dataframe,select=열이름) : 데이터세트에서 조건에 맞는 내용 조회 간단한 예제를 통해서 알아보자. 위의 그림은 Rstudio프로그램의 스크립트(Script)창에 명령어를 입력한 화면이다. subset을 사용하여 조건에 맞는 값들을 출력한다. 코딩설명 iris는 iris라는 데이터프레임을 사용하는 말이다. select= 부분은 iris의 Petal.Width와 Species 의 변수들을 결과를 출력한다는 내용이다. subset= 부분은 Petal.Width 변수의 값이 0.3 미만인 경우라는 조건을 입력한 것이다. [결과창] 위의 그림은.. 2014. 6. 3.
[R프로그램] rep함수 R프로그램의 rep함수에 대해서 알아보자. rep(반복할 값, 반복횟수) 로 나타낼수가 있다. 반복적인 값을 입력할 경우에 사용되며 더미(dummy) 변수로 값을 생성할 때 자주 사용된다. 위의 사진을 예를 들면 7이란 값을 10번 반복하겠다는 말이다. 결과를 봐도 7이라는 값이 10개가 생성됬음을 알 수 있다. rep의 times 옵션은 반복수를 말하는데 입력해도 되고 안해도 상관 없다. 문자형 데이터도 가능하다. jin이라는 문자를 3번 반복한다는 것인데 역시나 jin이라는 값이 3개가 생성이 되었다. each옵션은 간단하게 설명하자면 각각 반복해라는 옵션이다. 위의 사진을 예로 들면 0부터 2의 값을 각각 3번씩 반복하라는 의미이다. 결과도 마찬가지로 0을 3번, 1을 3번 2를 3번 각각 반복하여.. 2014. 4. 11.
[R프로그램] seq 함수 R프로그램의 seq함수에 대해서 알아보자. seq(from=시작, to=끝, by=간격) 이렇게 표현할 수가 있는데 시작부분과 끝부분을 정한뒤 간격을 입력해주면 그 조건에 맞게 값을 생성하는 것이다. 위의 사진을 보면 0을 시작으로 10까지 2간격으로 값을 생성한 것이다. from, to, by를 입력하지 않고 수치만 입력해도 무방하다. 위의 사진은 0을 시작으로 10까지 값의 길이?를 5개만 출력하라는 것이다. 시작과 끝의 값을 기준으로 간격이 일정한 값 5개를 생성하는 것이다. from과 to는 맨 위의 사진과 동일하게 입력하지 않아도 무방하지만 마지막 length는 입력해야한다. 이유는 미입력시 5를 by(간격)로 인식하여 결과값이 0, 5, 10으로 생성이 되기 때문이다. 위의 사진은 간단하게 수.. 2014. 4. 11.
[R프로그램] 수열 생성하는 방법 R프로그램을 이용하여 수열을 생성하는 방법을 알아보자. 수열은 설명하면 일정한 규칙으로 자연수를 정의역으로 하는 함수인데 이해하기 쉽게 규칙이 있으면 그 규칙에 맞게 일정하게 숫자가 늘어나거나 줄어드는 것으로 뭐 여러 등차, 등비, 조화수열 등으로 구분할 수 있다. 위의 사진을 보면 수열을 간단하게 생성해 본 사진이다. 1:7은 1부터 7까지 +1씩 증가한다는 말이다. 결과처럼 1, 2, 3, 4, 5, 6, 7 의 결과가 나옴을 알 수가 있다. 1:5의 값인 즉 1, 2, 3, 4, 5를 jin 이라는 변수로 할당을 하였다. 위의 사진은 이전과 반대인 높은 숫자부터 낮은 숫자 즉, 역으로 수열을 생성할때 사용한다. 방식은 같으며 높은 숫자부터 입력하면 된다.(위의 사진 참조) www.sasbigdata.. 2014. 4. 11.
[R프로그램] 변수와 벡터를 생성하는 방법 R프로그램에서 변수와 벡터를 생성하는 방법에 대해서 알아보자. [변수와 벡터생성] 생성할 변수명은 왼쪽에 입력한다. 아래의 사진과 같이 변수명을 입력한 뒤, ' 2014. 4. 10.