본문 바로가기



AI 관련 기술들/Data 분석

데이터 과학자를 위한 금융 분석 총론: 1장. 분석적 사고

"데이터 과학자를 위한 금융 분석 총론"의 "1장. 분석적 사고"에서는 금융 분석에 대한 기본적인 개요와 소개를 다루고 있기때문에 별다른 내용은 없다고 볼 수 있습니다.

 

핵심 내용을 간단히 추려보면 다음과 같겠네요.

 

빅사이언스(Big Science)라는 단어에서 유래된 신조어인 "빅데이터(Big Data)"는 공용 메모리 및 하드웨어 디스크와 전통적인 파일 및 관계형 데이터베이스에 적합하지 않은 데이터집합을 설명하는데 사용하는 용어다.

위키피디아와 같은 매체를 보면 "빅 데이터는 통상적으로 사용되는 데이터 수집, 관리 및 처리 소프트웨어의 수용 한계를 넘어서는 크기의 데이터"라는 식으로 정의를 내리고 있는데... 내용은 크게 다르지는 않지만 왠지 미묘한 표현의 차이가 느껴집니다. 

 

이 책은 금융 분석을 수행하는 개인과 수업에서의 실습을 증진하는 것을 목표로 하며, 빅데이터 처리에 필요한 모형, 프로그램 로직, 주식의 데이터집합, 기타 일반 증권에 대한 정보를 제공한다.

실습을 중시한다고 했으니 다양한 코드와 실습 예제를 많이 다룰 것 같습니다.

또한 주식이나 증권에 대한 정보를 제공한다고 하네요.

여기서 말하는 정보란 어떤 방식으로 분석해야 할 것인지.. 와 같은 방법론적인 정보, 방향성, 그리고 주식이나 증권과 관련된 기초 지식과 이론들이 소개될 것 같습니다.

금융 분석이라고는 하지만 은행과 같은 금융기관에서의 업무보다는 수많은 데이터를 통해 분석 및 예측을 수행하는 증권 분야의 데이터 분석이 중심이 되겠네요.

 

오늘날 소비자와 기업은 모두 소비자 가격, 산업 생산량, 이자율, 천연가스 가격 변동에 영향을 받는다. 이러한 변동은 리스크가 항상 존재한다는 사실을 의미한다.

금융 분석이라고 해서 돈의 흐름에 대한 데이터 만이 아니라 산업 전반에서 금융에 영향을 미칠 수 있는 다양한 데이터집합이 분석의 대상으로 보입니다.

금융과 산업, 투자는 서로 뗄 수 없는 관계이기때문에 당연한 것으로 생각됩니다.

 

많은 비즈니스 인텔리전스(Business Intelligence) 서적은 빅데이터에서 무엇(What)이 일어나는지를 중점적으로 설명하지만, 이 책은 어떻게(How) 상세한 결과를 얻을 수 있는가에 초점을 맞췄으며, 통계, 금융, 컴퓨터 과학을 아우른다.

책에서 다루고자 하는 전체적인 방향성을 확인할 수 있습니다.

실제로 다양한 빅데이터 분석 도서를 살펴보면 빅데이터에 대한 개요와 기본적인 이론의 설명을 대충 하고, Hadoop, Spark 등의 빅데이터 분석용 시스템이나 도구의 사용법, 사용예시 등을 주로 다루고 있습니다.

그러나 여기서 소개한 대로 데이터와 그 분석된 결과에 초점을 맞춘다면 더욱 본질적인 데이터 분석에 대하여 이해할 수 있을 것으로 기대됩니다.

 

최적화는 금융 분석에서 중요한 분야다.

최적화에 대해서 이야기를 하고 있습니다.

금융 분석만이 아니라 최근에 주목받는 분야인 인공지능(Artificial Intelligence, AI) 분야, 특히 Deep Learning 모델에서 가장 핵심이 되는 부분은 사실 네트워크의 최적화죠.

데이터 분석과 인공지능(딥러닝) 모델은 서로 영향을 주고 받는 관계에 있기때문에 최적화의 중요성은 이미 잘 알고 있습니다.

이 책을 통해서 금융 분석에서는 최적화가 어떻게 적용되는지 더욱 깊이 이해할 수 있다면 좋겠습니다.

 

유의미한 크기의 작업 모듈로 분석 문제를 해결하는 소프트웨어 시뮬레이션 연구소 구축 방법을 설명하는 것이 이 책의 목적이기 때문이다.

특히 기대되는 부분입니다.

단순히 데이터 분석 기법이나 관련 이론만을 소개하고 설명한다면 현실에서 직접 응용을 하려면 많은 시행착오를 요구할텐데 그런 시간을 많이 줄여줄 수 있기를 기대합니다.

 

공식 도출은 모형을 이해하는 데는 도움이 되지만, 기회비용 측면에서 보면 공식을 도출하는 것보다 운영 데이터 분석 플랫폼 구축에 시간을 할애해야 한다.

앞에서 살펴본 것처럼 기존의 많은 빅데이터 분석 관련 서적에서는 분석 도구나 분석 시스템에 중심을 두고 설명을 했었습니다.

마찬가지로 IT기술 분야의 서적이 아닌 경우에는 데이터 자체에 집중하기보다는 수학적인 이론, 수리 모델에 집중하고 있는 경우가 많았습니다.

정작 데이터에 집중한 서적은 그리 많지 않았죠.

이런 문제들을 이 책에서는 어떻게 해결해 줄 것인가..를 기대하고 있습니다.

 

 

1장에서 다루는 내용의 핵심은 지금까지 살펴본 내용정도라고 볼 수 있겠네요.

대부분 개요나 책의 방향성을 소개한 내용이므로 한 번 읽고 넘어가면 될 것 같습니다.

 

 

 

 

반응형