이번 장에서는 데이터 분석에 많이 사용되고 있는 언어인 R에 대한 간략한 소개와 사용법을 다루고 있습니다.
1976년에 AT&T의 벨 연구소에서 Rick Becker, John Chambers, Doug Dunn, Paul Tukey, Graham Wilkinson에 의해 개발, 발표된 이후로 통계분석 분야에서 많이 사용되던 언어가 S 언어입니다.
R 언어는 이러한 S 언어 프로젝트를 기반으로 개발된 오픈소스 변형으로, 뉴질랜드 오클랜드 대학의 Robert Gentleman, Ross Ihaka에 의해 개발되어 1993년에 처음 공개되었습니다.
R 언어의 문법과 통계처리 부분은 S언어를 참고하여 개발되었고, 데이터 처리 부분은 Scheme의 영향을 받았습니다.
R 언어의 대표적인 장점 두 가지는 먼저 LISP, Scheme, Python, Matlab 등과 공유할 수 있다는 점이며, 두 번째는 자유롭게 사용할 수 있는 4,000개가 넘는 패키지가 존재한다는 것입니다.
R 언어는 인터프리터형 언어로 설계되었으며 미리 컴파일된 C++ 모듈을 호출해서 사용함으로써 속도 측면에서의 병목 구간인 알고리즘 부분을 최적화 하고 있습니다.
최근 AI 등에서 많이 사용되는 Python 또한 수 많은 패키지를 제공하며, 인터프리터 언어이고, C++등으로 개발된 모듈을 이용하여 성능을 개선하고 있다는 점, 그리고 Python 역시 접착제 언어라고 불릴 정도로 다른 언어와 공유가 가능하다는 점에서 R 언어와 많은 부분에서 유사하다고 볼 수 있겠네요.
이번 글에서는 R 환경 설치를 위한 내용(R 설치, R-Studio 설치)을 캡처 이미지를 이용해서 간략하게 다루고, 다음 글에서는 R을 이용한 기초 문법의 예시와 Python 코드와의 비교를 다루어 보겠습니다.
첨부하는 이미지만 보시면 금방 따라할 수 있기 때문에 이번 글에서는 따로 설명은 하지 않겠습니다.
● R 설치하기
● R 실행해보기
● R-Studio 설치하기
● R-Studio 실행해보기
이상과 같이 아주 쉽게 환경 설정이 가능합니다.
Linux를 사용하는 경우에도 Windows에서 설치파일을 실행하는 부분(Linux는 exe파일을 사용하지 않으니까요)만 차이가 있고 나머지는 동일합니다.
Python을 사용하는 경우 많은 분들이 Jupyter Notebook을 사용하고 계시는데 Jupyter Notebook에서도 R 언어를 지원하고 있으므로 R-Studio 대신 Jupyter Notebook을 사용하는 분들도 많습니다.
이제 다음 글에서는 R과 Python으로 구성된 간단한 기초 예제코드를 서로 비교해 보겠습니다.
'AI 관련 기술들 > Data 분석' 카테고리의 다른 글
데이터 과학자를 위한 금융 분석 총론: 1장. 분석적 사고 (0) | 2022.07.07 |
---|---|
데이터 과학자를 위한 금융 분석 총론: 시작 (0) | 2022.07.02 |
데이터 분석의 힘: 6~7장 (0) | 2020.01.04 |
데이터 분석의 힘: 5장 (0) | 2019.12.26 |
R과 파이썬을 사용한 통계 계산 시작하기 (1) (0) | 2019.12.19 |