본문 바로가기



AI와 IT 이야기

자연어 처리를 공부하기 전에... AI와 자연어처리에 대하여 생각해보자.

최근 자연어 처리에 대한 다양한 기술, 언어모델 등이 쏟아져 나오고 있습니다.

기존의 AI 교육은 영상인식, 처리 등에 더 많이 치중되어 있었지만 이제 자연어 처리 기술의 교육에 대한 수요가 늘어나고 있습니다.

그만큼 자연어 처리에 대한 중요성이 많이 알려졌다는 것이겠죠.

 

그럼 자연어 처리를 공부하기 전에 왜 자연어 처리가 중요한지 한 번 생각해 보도록 하겠습니다.

 

먼저 우리가 생각하는 AI는 무엇일까요?

다양한 그룹을 대상으로 강의를 하면서 느낀 것은 AI 기술이 뜨기 시작하니까 나도 배워보자.. 라는 수강생이 대부분이라는 것입니다.

어떻게 보면 정말 AI에 대하여 제대로 공부하고 연구하려는 사람은 해당 전공으로 대학교를 가거나.. AI를 전문으로 하는 연구소로 가겠죠.

그래서 AI가 무엇이다.. 라는 내용에 대하여 별다른 생각을 하지 않더군요.

AI가 무엇이냐? 라고 물어보면 사전적인 의미, 여러 교재에서 말하는 정의를 이야기하는 선에서 그칩니다.

왜 영상인식쪽이 많이 연구되어 왔고, 왜 요즘 자연어처리가 뜨기 시작하는지.. 등에 대해서도 생각하지 않습니다.

 

그래서 자연어 처리를 공부하기 전에 제 나름대로 한 번 생각해 보았습니다.

왜 그런지..

 

현재 연구되고 개발되는 AI는 무엇일까요?

흔히 말하는 강 인공지능이나 약 인공지능과 같은 분류와도 관계가 있습니다.

 

AI란 Artificial Intelligence, 즉 인공 지능이죠.

말 그대로 인공적으로 만들언진 지능이라는 것입니다.

인공적이라는 말은 사람이 만들어낸 것이란 뜻이죠.

그렇다면 지능이란 무엇일까요?

안타깝게도 지능에 대한 정의는 아직까지 명확하게 내려지지 않고 있습니다.

지능이란 것을 명확하게 정의하기에는 현재 인류의 기술로는 모르는 부분이 너무 많아서.. 입니다.

 

그래서 많은 연구자들은 편법을 써 왔습니다.

지능이 무엇인지는 아직 잘 모르니까 지능적이라고 볼 수 있는 인간(동물)의 여러 기능을 흉내내어보자.. 라는 것입니다.

인간만이 아니라 동물도 포함됩니다만 이후 글에서는 그냥 인간, 사람으로 지칭하겠습니다.

 

그럼 사람이 보여주는 지능적인 기능에는 무엇이 있을까요?

 

사람에게서 찾을 수 있는 대표적인 지능적인 기능을 살펴보면 오감(시각, 청각, 촉각, 후각, 미각)이 있습니다.

 

시각을 구현하는 분야가 Computer Vision, 즉 영상 인식, 처리 등의 분야입니다.

흔히 사람의 몸을 1,000냥이라고 하면 그 중에서 눈이 900냥이라고 하듯이 우리가 생각할 수 있는 지능적인 기능에서 가장 큰 영역을 차지하고 있죠.

그래서 실제적으로도 영상과 관련된 연구가 가장 많이 진행되어왔고, 또 가장 먼저 떠올랐다고 볼 수 있습니다.

 

청각은 발성과도 연결된 기능이며 청각과 관련된 부분이 오디오 처리 기술쪽이겠지요.

대표적인 연구, 개발 결과로 AI Speaker를 생각할 수 있습니다.

 

촉각, 후각, 미각은 최근에 성과가 많이 나오기 시작하고 있지만 아직 센서 기술쪽의 비중이 더 큰 편입니다.

 

오감을 흉내내고 나면 무엇이 필요할까요?

오감을 지능적인 기능으로 분류하면서 많은 AI 기술이 연구되어왔지만...

한 편으로는 오감은 기계적인 반응을 보이는 영역입니다.

사람의 의지가 반영되지 않고 그냥 보이는대로, 들리는대로, 느껴지는대로 반응하는 영역이죠.

그러나 이런 반응을 위해서 다양한 학습이 요구되고 있기때문에 지능적인 기능으로 분류된 것이라고 볼 수 있습니다.

 

오감 이외에 사람의 지능적인 기능... 여기서는 기능이라고 보는것 보다 반응 방식이라고 보는 것이 더 나아보이네요.

아무튼 오감 이외의 지능적인 행위는 바로 사고 행위입니다.

사고 행위의 모방이야말로 제대로 된 지능의 모방이 될 것입니다.

그러나 지능에 대한 정의가 제대로 내려지지 않았기때문에 우리는 사고 행위를 그대로 구현할 수가 없습니다.

그래서 선택한 방식이 사고 행위의 결과로 나타나는 반응을 특정 기능으로 묶어서 흉내를 내보자.. 라는 것입니다.

그 기능들이 데이터 처리, 의사 결정, 언어 처리 등이며 이런 기능들을 처리함으로써 사고행위의 모방을 우회하여 구현하는 것입니다.

 

여기까지 살펴본 다양한 기능의 모방 분야가 바로 우리가 주변에서 쉽게 볼 수 있는 인공지능의 연구, 개발 분야입니다.

 

 

 

 

 

 

 

 

 

그럼 요즘 뜨고 있는... 아니... 대기업들이 눈에 불을 켜고 집중하고 있는 자연어 처리, 언어 모델의 개발은 어떤 관계가 있을까요?

 

지금까지 살펴본 모든 AI 분야는 한 개인, 개체의 내부에서 이루어지는 것들에 대한 모방입니다.(자연어 처리 빼고)

그래서 제대로 된 지능이라고 말하기 어렵습니다.

왜냐하면... 사람은 사회적인 동물이기 때문이죠.

 

진부해 보이기는 하지만.. 이게 중요합니다.

사람은 사회적인 동물입니다.

크건 작건 사회(또는 조직)를 구성하여 그 안에서 생존해왔습니다.

그렇기때문에 서로의 의사를 전달할 필요가 생겼습니다.

또한 단순히 의사 전달에서만 그치지 않고 살아가면서 얻은 지식과 지혜를 세대를 거쳐서 누적시켜왔습니다.

이러한 과정에서 필요한 것, 발생한 것이 바로 언어(자연어)인거죠.

그리고 이러한 언어는 의사소통의 범위를 넘어서 개인, 개체의 내부에서도 지식을 저장하고, 생산하기 위한 도구가 되었습니다(언어가 발생하기 이전의 인간의 진화속도가 느린 이유는 내부적으로 지식을 구조화하여 저장할 방법이 없었기 때문이라고 보는 견해가 많습니다).

언어와 인간은 서로에 대한 영향력이 재귀적으로 순환하며 진화하기 시작한 것입니다.

 

Pixabay - Nugrobo Dwi Hartawan

 

개체 내부에서... 개인적으로 인식하고 처리하고 결정하기만 하는 소극적이고 기계적인 지능(오감과 언어처리를 제외한 사고행위의 모방)의 구현은 현재 상당한 수준까지 진행되었기때문에...

이제는 사람이 가지는 사회적인 특징, 그리고 자체적인 지식의 구조화와 누적의 구현에 집중하기 시작한 것입니다.

그래서 언어, 즉 자연어의 처리가 핵심이 되기 시작한 것입니다.

 

지금 발표된 대표적인 자연어 처리를 위한 언어모델들, 미국 OpenAI의 GPT3, 네이버의 HyperCLOVA, 카카오의 민달리, LG의 엑사원 등은 언어모델이라고 부르지 않고 초거대 AI라고 부르고 있습니다.

자연어 처리를 위한 모델을 중심으로 거대한 규모의 파라미터를 이용하여 입력된 언어 표현을 구조화하여 지식을 구성, 표현함으로써 단순한 자연어 처리를 벗어나 지금까지 개발된 영상, 음성, 데이터 분석, 의사결정 등 다양한 AI 기술들을 연동, 구현하고 있습니다.

 

지금까지 편법을 통해서 진행해 온 AI의 연구 범위가 자연어를 기반으로 "언어와 인간은 서로에 대한 영향력이 재귀적으로 순환하며 진화한"것처럼 서로 연결되기 시작했다고 생각할 수 있습니다.

사람이 지능적이게 된 흐름을 따라가기 시작한 것입니다.

 

이제 자연어가 단순히 처리의 영역을 벗어나서 구조화되고... 그 구조들의 연결과 처리방식이 점점 사람과 닮아갈수록 제대로 된 지능... 지식의 구조화, 지능의 발생 등의 가능성이 생기기 시작하겠죠.

 

이런 식으로 자연어 처리가 AI 분야의 핵심이 되었다고 볼 수 있습니다.

 

 

참고로... 이 글의 내용은 제가 생각하는 내용이므로... 세계적으로 공식적인 내용은 아닙니다.

그러나 인류의 진화과정이나 사람의 생체기능들을 기준으로 하나씩 풀어나가보면 이런 식으로 흘러갔다고 볼 수 있다는 것이 제 생각입니다.

(생각하면서 바로 글을 써서 그런지... 내용이 좀 어수선하긴 하네요.. 언젠가 정리를 할 필요는 있어 보입니다..)

 

그럼 다음 글부터는 자연어 처리에 대해서 하나씩 공부해 보도록 하겠습니다.

 

 

 

 

 

 

 

 

 

반응형