AI와 데이터 분석, 데이터 과학을 공부하고 연구해 나가려면 다양한 분야의 지식이 필요합니다.
실제로 어떤 시스템을 만들어야 할까? 와 같은 아이디어나 실제 적용을 위한 해당 분야별 전문 지식, 어떤 데이터를 구성해야 효율적인 학습이 이루어질까? 와 같은 데이터 입장에서의 분석 능력 등 매우 종합적인 학문 분야라 바로 AI, 인공지능과 데이터 과학 분야입니다.
이런 다양한 분야의 지식 중에서도 특히 중요한 분야가 통계학과 수학 분야라고 생각하고 있습니다.
다른 분야도 역시 중요하지만 통계학적인 지식이 없다면 가장 기반이 되는 데이터의 선택, 구성에서부터 길이 막힌 것 같은 느낌을 받게 될 것입니다.
우리가 만들고자 하는 AI 모듈은 어떤 결과를 요구하고 있으며 그 결과를 위해 어떤 데이터가 필요한지 알지 못한다면 시작부터 길을 잃고 말겠죠.
우리가 구하려는 결과를 위해서 어떤 데이터를 입력 받고, 그 데이터를 효율적으로 학습, 활용하기 위해서는 어떻게 가공해야 할 것인가에 따라 전체적인 모델의 방향도 결정됩니다.
물론 구할 수 있는 데이터를 모두 적용해서 모델을 계속 개선해 나갈 수도 있습니다.
그러나 그런 방법은 얼마나 많은 노력과 시간을 요구하게 될까요?
또한 수학적인 지식이 없다면 모델을 어떻게 구성하고 구현해야 하며 모델 안에서 수행되는 수 많은 연산들은 어떻게 설계하고 적용해야 할까요?
앞에서 말씀드린 다양한 분야에 대한 지식은 어떤 AI 모델을 만들 것인가? 어떤 분야에 적용할 것인가? 등의 좀 더 활용적인 측면에서 중요한 지식이라면 통계학과 수학의 지식은 실제로 AI 모델을 설계하고 구현하기 위한 필수 항목이라고 볼 수 있습니다.
요즘은 텐서플로, 케라스 등 이미 많은 라이브러리, 플랫폼들이 제공되고 있으며 이러한 환경을 잘 활용해서 AI 모델을 개발한다면 통계학과 수학은 크게 중요해 보이지 않을 수도 있습니다.
그러나 단순한 개발자가 아니라 실제 환경에 가장 적합한 AI 모델을 설계하고, 데이터 환경을 설계, 구축하고, 또한 이런 모든 것들을 효율적으로 융합해서 활용하기 위해서는 가장 기본이 되는 지식은 제대로 익해둘 필요가 있습니다.
통계학과 수학적 지식이 뒷받침 된 후에는 우리가 개발하고자 하는 AI모델 및 적용 환경에 따라 뇌과학 및 신경과학, 생물학, 화학, 물리학 등 다양한 전문 분야에 대한 지식도 필요할 수 있습니다.
그 많은 분야를 어떻게 다 공부합니까? 라고 생각하실 수도 있습니다.
그래서 대부분의 AI 팀은 혼자서 운영하지 않고 다양한 분야의 팀원으로 구성되는 거죠.
시작도 하기 전에 포기하고 싶을 수도 있습니다만 너무 크게 걱정하지는 않으셔도 됩니다.
AI를 개발하기 위해서 우리가 수학자, 통계학자가 될 필요는 없습니다.
물론 되실 수 있다면 가장 좋겠지만요.
우리는 단지 수학과 통계학에서 필요한 분야의 이론만을 추출하여 활용할 수 있으면 됩니다.
이미 많은 개발자들과 연구자들이 AI 개발에서 많이 사용되는 이론들을 정리해 두었고, 각 인터넷 사이트나 전문 서적으로도 많이 출판되고 있습니다.
그럼 지금부터 우리가 필요로 하는 통계학, 수학, 그리고 기타 과학 분야 및 각 도메인 지식들을 이 카테고리에서 하나씩 정리해 가도록 하겠습니다.
많은 관심을 부탁드립니다.
'AI 기반 기술' 카테고리의 다른 글
데이터 과학을 위한 통계: 시작하면서 (0) | 2019.11.14 |
---|---|
활성화 함수의 개념과 필요성 (0) | 2019.10.31 |
다층 퍼셉트론과 Back Propagation 학습 알고리즘 (0) | 2019.09.04 |
하나의 층을 가진 신경망, 단층 퍼셉트론 (3) | 2019.09.04 |
데이터 분석은 무엇이고 데이터 과학은 무엇인가? (0) | 2019.09.02 |