요즘 IT 분야에서 가장 중요하게 여겨지는 기술분야는 AI (Artificial Intelligence, 인공지능) 기술입니다.
대부분의 사람들이 알고 있듯이 2016년 3월 9일~15일 사이에 개최된 알파고와 이세돌의 대국 이후로 AI 기술은 전세계의 과학기술, IT, 산업계를 휩쓸고 있습니다.
특히 AI 분야가 눈길을 끌지 못하고 있던 대한민국은 그 여파가 더욱 컸었죠.
올 해, 2019년 7월 일본 소프트뱅크 그룹의 손정의 회장이 한국을 방문하면서 제언했던 것처럼 "앞으로 한국이 집중해야 할 것은 첫째도 AI, 둘째도 AI, 셋쩨도 AI이다" 라는 말과 같이 앞으로 AI는 거의 모든 분야에서 그 영향력을 강하게 발휘할 것입니다.
그렇다면 이렇게 세계를 뒤흔들고 있는 AI란 과연 무엇일까요?
많은 이들이 알고 있듯이 AI는 인공지능, 즉 인간의 지능을 모방 또는 흉내내고 있는 컴퓨터 프로그램, 알고리즘 기술이며 특히 인간의 학습기능의 모방하는 알고리즘에 대한 연구, 개발이 중심이 되고 있습니다.
이렇게 간단한 개념이지만 대부분의 사람들은 AI 기술의 연구, 개발에 쉽게 접근하지 못하고 있습니다.
왜 그럴까요?
또한 인간의 지능을 모방하고 있다고 하는데 출시되거나 발표되는 제품, 서비스는 주로 영상인식(영상을 통한 개체 인식, 불량탐지 등 관련분야를 모두 포함합니다)과 합성, 음성인식과 합성, 챗봇이나 번역앱을 위한 자연어의 인식 및 처리와 같은 분야에 치중되어 있습니다.
그 외의 제품과 서비스는 AI를 적용했다고 하지만 알고리즘적으로 통계학을 적용하는 수준과 큰 차이를 느끼지 못하는 경우가 대부분입니다.
이것은 또 왜 그럴까요?
이런 문제에 대해서는 여러 가지 의견이 있습니다만 저는 갑작스럽게 등장한 미래형 첨단 기술분야에 대하여 사람들이 일종의 환상을 가지게 된 것이라고 보고 있습니다.
실제 AI 기술 분야는 이미 매우 오래된 학문이며 기술입니다.
갑자기 등장한 미래형 첨단 기술이 아닙니다.
물론 지금까지 수 차례의 침체기를 반복해서 겪으며 발전해 왔기때문에 초창기의 기술 및 연구 성과와는 비교할 수 없지만 기본 개념은 동일하죠.
오랫동안 침체기에 있다보니 일반적인 사람들은 그 과정을 잘 알지 못했고 결국 갑자기 등장한 기술로 인식하기 시작한 것입니다.
이러한 이유로 AI 기술 개발 또는 연구를 시작하고자 하는 사람들은 최신 기술을 중심으로 살피기 시작하였고, 주변에서 제품과 서비스가 시작되고 있는, 즉 쉽게 접할 수 있는 영상인식, 음성인식, 챗봇과 같은 분야에 한정되게 되었습니다.
다행히 지금은 많은 학습자료들이 인터넷 및 서적을 중심으로 보편화 되고 있으므로 점점 그런 문제는 해결되고 있다고 볼 수 있겠네요.
그렇다면 우리는 AI라는 기술에 어떻게 접근을 해야 할까요?
그것은 무엇을 위해 AI를 연구하고자 하는가에 따라 다릅니다.
* 서비스 또는 제품에 AI 기능을 적용하기 위하여 개발 자체가 중요할 때
아마 이 글을 읽으시는 대부분의 독자들은 이 경우에 포함될 것 같습니다.
AI의 본질의 이해와 연구보다는 단순히 기능을 구현하고 개발하는 자체가 중요한 경우에는 구글, 아마존, MS 등이 제공하는 라이브러리, 플랫폼 및 클라우드 서비스를 이용하는 것이 좋습니다.
요즘 출판되는 AI 개발 관련서적이나 유명한 강좌들도 주로 Tensorflow, Keras 등과 같은 라이브러리나 플랫폼 같은 것을 이용하여 AI 개발을 위한 지식을 제공합니다.
내부적으로 상세한 이론을 모르더라도 충분이 AI 기능을 구현하고 제품, 서비스에 적용할 수 있으며 학술 논문 등을 통해서 발표되는 새로운 알고리즘들도 이러한 라이브러리, 플랫폼 등을 이용하므로 가장 무난하게 접근할 수 있는 방법이라고 볼 수 있습니다.
어느 정도 AI 기술의 구현이 익숙해지게되면 서서히 AI에 대한 이론적인 부분도 이해가 되기 시작할 것입니다.
* AI 모델에 대해서 제대로 이해하고 연구하는 것이 중요할 때
이 경우에는 정말 공부할 것이 많습니다.
먼저 어떤 모델을 중심으로 진행할 것인지를 결정해야 하는데... 아무래도 요즘 시작하는 경우라면 거의 대부분이 딥러닝(Deep Learning)을 선택하시겠죠?
일단 요즘 유행하고 있는 딥러닝을 기준으로 생각하겠습니다.
딥러닝의 기반은 신경망 알고리즘입니다.
신경망 알고리즘이란 것은 인간을 포함한 동물의 뇌를 구성하고 있는 신경세포들의 연결된 상태를 모방한 것입니다.
그러나 말이 모방이지 극단적으로 단순화 시킨 모델이라고 보시면 됩니다.
신경망 기반의 모델을 연구하기 위해서는 뇌과학 분야를 공부해야 한다... 라고 말씀하시는 분들도 많습니다.
물론 뇌과학 쪽을 깊게 파고 든다면 많은 도움이 될 것입니다.
그러나 컴퓨터에서 구현되는 AI 모델로서의 딥러닝 알고리즘을 목적으로 하기에는 뇌과학 분야는 너무 범위가 넓고 어렵습니다.
오히려 통계학과 데이터 분석을 기반으로 하는 데이터 과학 분야, 그리고 최적화 알고리즘 분야를 집중하는 것이 더 현실적이라고 생각합니다.
다양한 딥러닝 기반의 모델들을 살펴보면 큰 형태는 단순화된 신경망의 형태를 따르고 있지만 그 내부의 연산은 결국 신경세포에 해당하는 각 노드들의 값을 우리가 원하는 결과로 만들기 위한 최적화 과정입니다.
많은 입력 데이터가 각 노드에 분산, 전달될 때 어떤 최적화된 값을 노드별로 적용하면 원하는 결과가 나올 수 있는가.
이 내용을 수없이 많은 반복을 통해서 하나의 입력 데이터가 아닌 다수의 입력 데이터에 골고루 반영될 수 있도록 최적화하는 과정.
그것이 바로 딥러닝의 내부에서 이루어지는 학습 연산입니다.
이런 과정이 익숙해 진 후에 좀 더 상위 단계에서 신경망의 구조를 더 효율적으로 배치하는 것이 새로운 모델을 만들어 내거나 기존 모델을 개선하는 과정이 됩니다.
다시 말씀드리자면, AI 모델에 대하여 이론부터 제대로 이해하고 연구하기 위해서는 먼저 데이터 분석 및 데이터 과학, 최적화 알고리즘을 이해하고 그 상위의 신경망을 구성하는 모델링 과정을 이해하셔야 합니다.
이런 과정이 끝난 후에는 일반적인 주장처럼 뇌과학이든, 양자역학이든.. 모델을 더욱 확장시키기 위한 분야로 연구 범위를 넓혀가야 합니다.
지금까지 AI 기술을 연구하기 위하여 우리는 어떻게 접근하고 시작해야 하는지 살펴보았습니다.
일단 제 경우는 위에서 제시한 두 가지의 목적 중에서 후자에 해당하기 때문에 본 블로그의 AI 카테고리에서는 후자를 기준으로 이야기가 진행될 계획입니다.
그러나 실제 구현이 뒷받침하지 않을 경우, 많은 부분에서 설명이 어려울 수도 있기때문에 후자를 기준으로 하되 전자의 내용을 함께 보완하는 방향으로 운영될 것입니다.
그럼 이후의 글도 많은 관심을 부탁드립니다.
'AI 관련 기술들 > AI' 카테고리의 다른 글
다층 퍼셉트론과 Back Propagation 학습 알고리즘 (0) | 2019.09.04 |
---|---|
하나의 층을 가진 신경망, 단층 퍼셉트론 (3) | 2019.09.04 |
데이터 분석은 무엇이고 데이터 과학은 무엇인가? (0) | 2019.09.02 |
신경망 이해부터 시작하자. (0) | 2019.08.23 |
머신러닝이란 어떤 것인가? (0) | 2019.08.23 |