본문 바로가기



AI와 IT 이야기

ChatGPT 이전에 썼던 논문의 내용을 보고..

이번에 안동대학교에서 "생성형 AI 기반의 문화콘텐츠 개발"이라는 주제로 실시간 온라인 특강을 했습니다.

특강 자료를 준비하던 중 2021년에 썼던 논문이 보이더군요.

 

"민화와 풍속화를 이용한 AI 기반의 콘텐츠 원천 데이터 생성 모델의 연구"라는 제목으로 썼던 논문인데...

뭐.. 사실 진행 중이던 과제를 통해서 썼던 내용이라 순전히 제가 관심이 있던 연구라기보다는 과제의 주제에 맞춰서 쓴 경향이 있긴 합니다만 그래도 나름 고민을 해 가면서 썼던 내용이었습니다.

 

우리 주변에서 볼 수 있는 민화나 풍속화 등을 분석하여 당시의 시대상, 관련된 이야기나 역사적 사실 등을 데이터베이스화하고, 민화/풍속화의 분석 내용으로부터 다양한 키워드를 추출함으로써 연관된 내용들을 검색한 후, 사용자가 의도하는 큰 스토리라인을 기반으로 새로운 스토리를 만들어내는 모델... 이라고 하면 될 것 같네요.

 

그 당시에도 제일 고민했던 부분이 어떻게 저 데이터들로 자연스러운 스토리를 만들어 낼까.. 라는 부분이었습니다.

결국 그 단계까지 가지 못하고 과제가 끝나버려서 미완의 상태로 남았었는데...

그런데... 2022년 11월 30일 OpenAI가 ChatGPT를 발표하면서.. 그리고 LLM(거대 언어 모델, Large Language Model)이 전세계적으로 확산되면서 해당 부분은 그냥 묻혀버렸네요.

 

원래 사람의 사고과정이란 것이 언어를 기반으로 구성되었다보니 어마어마한 규모의 텍스트 데이터들이 상상도 하지 못할 정도의 규모로 네트워크가 만들어지고 최적화가 이루어진 형태인 현재의 LLM에서는 어떤 특별한 구조를 만들지 않아도 제가 고민해왔던 부분이 알지 못하는 사이에 해결(?)되어 버린 상황이 된거죠.

 

지금 생각하니 처음부터 개인이 해결할만한 규모의 문제가 아니었던 것 같긴합니다. ㅠㅠ

현재의 LLM이 가진 데이터의 규모, GPU와 전력 등을 포함하여 요구되는 시스템 자원의 규모... 혼자 한다고 생각하니 막막하기만 하네요.

 

최근 들어서 AI 분야가 흘러가는 분위기를 보고 있으니 과연 개인이 노력해서 어디까지 갈 수 있을까..라는 의문이 듭니다.

동시에 과연 지금같은 엄청난 자원을 소모하는 모델만이 정답일까.. 라는 의문도 동시에 가지게 됩니다.

인간의 지능적인 행위를 모방하기 위해서 더욱 근원적인 신경망의 모방을 시작점으로 하여 진행되어 오던 흐름이 언어라는 개념을 포함하기 시작한 것은 저도 AI를 연구하기 시작했던 시기부터 생각해 오던 내용이다보니 이견이 없습니다만...

지금의 상황은 뭔가 살짝 다르지 않나.. 길이 조금 어긋난 것이 아닐까?..라는 생각을 하게 되네요.

좀 더 가볍게, 그리고 쉽게 만들어나갈 수 있는 방법이 있지 않을까...

결국 현재의 LLM을 기반으로 한 방법과는 조금 다른 모델이 필요해지겠지요.

 

시도해보고 싶습니다만.. 먹고 살기 위해 허덕이는 지금 상황에서 어디까지 가능할까..

지금까지 겪었던 일들... 새로운 개념을 떠올리고 구현해보려고 노력하는 도중에 다른 누군가가 비슷한 개념을 먼저 발표해버려서 아깝게 기회를 놓쳐버리는 그런 일들이 반복되는 것은 아닐까.. 라는 생각을 먼저 하게 됩니다.

(요즘 광범위하게 사용되는 JSON 파일도 그런 경우였죠. 실무에서도 제가 만든 모듈을 적용 하고 있었는데.. 그러나 그 당시에는 오픈소스라던가.. 더 글로벌하게 뭔가 한다는 생각을 미처 못했던 시기였습니다. 아쉽네요.)

 

한편으로는 너무 현실에 묻혀서 시간을 흘려보내고 있던 것이 아닌가..라는 반성도 하게 되는 밤입니다.

 

그림: MS Designer Image Creator로 직접 그림

 

 

 

 

반응형