본문 바로가기



AI 관련 기술들/Data 분석

데이터 과학자를 위한 금융 분석 총론: 2장. 금융 분석 전문 언어, R (1)

이번 장에서는 데이터 분석에 많이 사용되고 있는 언어인 R에 대한 간략한 소개와 사용법을 다루고 있습니다.

 

1976년에 AT&T의 벨 연구소에서 Rick Becker, John Chambers, Doug Dunn, Paul Tukey, Graham Wilkinson에 의해 개발, 발표된 이후로 통계분석 분야에서 많이 사용되던 언어가 S 언어입니다.

 

R 언어는 이러한 S 언어 프로젝트를 기반으로 개발된 오픈소스 변형으로, 뉴질랜드 오클랜드 대학의 Robert Gentleman, Ross Ihaka에 의해 개발되어 1993년에 처음 공개되었습니다.

R 언어의 문법과 통계처리 부분은 S언어를 참고하여 개발되었고, 데이터 처리 부분은 Scheme의 영향을 받았습니다.

 

R 언어의 대표적인 장점 두 가지는 먼저 LISP, Scheme, Python, Matlab 등과 공유할 수 있다는 점이며, 두 번째는 자유롭게 사용할 수 있는 4,000개가 넘는 패키지가 존재한다는 것입니다.

R 언어는 인터프리터형 언어로 설계되었으며 미리 컴파일된 C++ 모듈을 호출해서 사용함으로써 속도 측면에서의 병목 구간인 알고리즘 부분을 최적화 하고 있습니다.

 

최근 AI 등에서 많이 사용되는 Python 또한 수 많은 패키지를 제공하며, 인터프리터 언어이고, C++등으로 개발된 모듈을 이용하여 성능을 개선하고 있다는 점, 그리고 Python 역시 접착제 언어라고 불릴 정도로 다른 언어와 공유가 가능하다는 점에서 R 언어와 많은 부분에서 유사하다고 볼 수 있겠네요.

 

이번 글에서는 R 환경 설치를 위한 내용(R 설치, R-Studio 설치)을 캡처 이미지를 이용해서 간략하게 다루고, 다음 글에서는 R을 이용한 기초 문법의 예시와 Python 코드와의 비교를 다루어 보겠습니다.

첨부하는 이미지만 보시면 금방 따라할 수 있기 때문에 이번 글에서는 따로 설명은 하지 않겠습니다.

 

● R 설치하기

https://cran.r-project.org에서 다운로드
설치용 실행파일을 이용하는 경우

 

● R 실행해보기

기본 제공되는 GUI 개발 도구인 RGUI (디자인이 투박합니다.)
인터프리터 언어로 간단하게 연산, 그래프 그리기 등을 사용할 수 있습니다.

 

 

 

 

● R-Studio 설치하기

https://www.rstudio.com에서 다운로드 (Free 버전을 다운로드 하면 됩니다)

 

● R-Studio 실행해보기

RGUI보다 세련된 인터페이스 화면을 제공합니다.
간단하게 작업 폴더 설정하기(1) : 오른쪽 하단 박스에서 원하는 경로로 이동합니다.
간단하게 작업 폴더 설정하기(2) : 설정 아이콘을 눌러서 작업 폴더를 설정합니다.
간단하게 작업 폴더 설정하기(3) : 설정 아이콘을 눌러서 작업 폴더를 설정합니다.
간단하게 작업 폴더 설정하기(4) : 설정 아이콘을 클릭하면 왼쪽에 설정 스크립트가 표시되면서 설정이 완료됩니다.
RGUI와 동일한 샘플 코드를 실행해 보았습니다.

 

이상과 같이 아주 쉽게 환경 설정이 가능합니다.

Linux를 사용하는 경우에도 Windows에서 설치파일을 실행하는 부분(Linux는 exe파일을 사용하지 않으니까요)만 차이가 있고 나머지는 동일합니다.

 

Python을 사용하는 경우 많은 분들이 Jupyter Notebook을 사용하고 계시는데 Jupyter Notebook에서도 R 언어를 지원하고 있으므로 R-Studio 대신 Jupyter Notebook을 사용하는 분들도 많습니다.

 

이제 다음 글에서는 R과 Python으로 구성된 간단한 기초 예제코드를 서로 비교해 보겠습니다.

 

 

 

 

반응형