본문 바로가기

AI & IT

GPT-OSS / GPT-5의 발표.. 그 밑에 깔린 OpenAI의 전략은 무엇일까?

 

UTC(협정 세계시, Universal Time Coordinated) 기준 8월 5일, OpenAI가 GPT-OSS모델(gpt-oss-120b/gpt-oss-20b)Open Weight 방식으로 공개했습니다. ( https://openai.com/ko-KR/index/introducing-gpt-oss/ )

 

2019년 GPT-2 이후로 OpenAI는 폐쇄모델의 기조를 유지해오고 있었던터라 6년만에 발표된 Open Weight 모델에 업계 및 학계의 많은 관심이 쏠리고 있습니다.

 

Open Weight 방식이란 모델의 학습된 파라미터(Weight, 가중치), 즉 신경망의 뇌에 해당한다고 할 수 있는 모델의 모든 연결 값을 공개하는 방식을 말하며 Hugging Face 등에서 다운로드 할 수 있는 .safetensors 파일 형태를 생각하시면 됩니다.

Open Weight 방식으로 공개된 모델은 딥러닝 모델의 구조와 가중치가 모두 직접 제공되기때문에, 파일을 직접 다운로드하여 로컬 시스템에서 직접 실행, 분석, 수정, 재학습(파인튜닝)이 가능합니다.

 

Ollama, LangChain 등을 사용하여 .safetensors 파일을 로컬 시스템에서 사용할 수 있게 하는 방법은 예전 포스트에서 다룬 적이 있으니 참고하시기 바랍니다.

 

https://aidalab.tistory.com/290

 

LLM의 safetensor 파일을 로컬 시스템에서 사용하기

시스템에 LLM을 적용하기 위해서는 LLM을 서버에 직접 설치해서 사용하거나 LLM을 서비스하는 업체/기관의 Open API를 사용하여야 합니다.후자의 경우는 유료서비스이므로 개발 중에 사용하기는 부

aidalab.tistory.com

 

 

또한 이번에 발표된 GPT-OSS 모델은 기존의 폐쇄된 모델 및 라이선스가 아니라 오픈소스 중에서 가장 자유로운 사용을 보장하는 3가지 라이선스(Apache-2.0, MIT, BSD) 중 하나인 Apache-2.0이 적용되어 있으므로 누구나 자유롭게, 상업적인 목적으로도 마음껏 활용할 수 있는 모델이 되었습니다.

 

그리고 예상보다 가벼운 시스템에서도 무리없이 작동하도록 만들어져 시스템 사양 및 비용 문제로 최신 모델을 활용하거나 연구, 개발에 사용하지 못하던 사용자들도 쉽게 사용이 가능해졌습니다.

대형모델로 만들어진 gpt-oss-120b의 경우는 단일 80GB H100 GPU에서 실행 가능하며, 소형모델로 만들어진 gpt-oss-20b의 경우는 16GB RAM을 가진 일반 노트북에서도 무리없이 실행 가능하다고 합니다.

솔직히 개인의 경우에는 단일 80GB H100 GPU 환경조차 준비하기 어려운 상황이지만 gpt-oss-20b 정도의 모델이라면 누구나 사용할수 있다는 것이 매우 큰 장점으로 다가오고 있습니다.

 

기존 모델과 성능을 비교해보면 gpt-oss-120b는 o4-mini 수준의 성능을 제공하며 고급 추론 작업에서 뛰어난 성능을 발휘하고, gpt-oss-20b는 o3-mini 수준 이상의 성능을 가지며 일반 하드웨어에서 실행가능함을 강조하고 있습니다.

특히 Edge-AI를 목표로 하는 개발자라면 희소식이 아닐 수 없습니다.

 


 

그렇다면 OpenAI는 이렇게 뛰어난 성능을 가진 모델을 왜 지금까지의 정책을 바꾸면서까지 공개하게 된 것일까요?

진정한 목적은 당사자가 아니라면 알 수 없지만 뒤따르는 GPT-5의 발표는 어느 정도 목적을 추측할 수 있게 해 줍니다.

 


 

GPT-OSS 모델 발표로부터 이틀 후인 8월 7일, OpenAI는 GPT-5를 발표하였습니다.

 

https://www.aitimes.kr/news/articleView.html?idxno=35975

 

"AGI로 가는 중요한 이정표"...오픈AI 'GPT-5' 공개, 박사급으로 더 똑똑하고·빠르고·유용한 모델 -

오픈AI(OpenAI)가 7일(현지시각) 라이브 스트리밍을 통해 역사상 가장 진보된 차세대 인공지능(AI) 모델 ‘GPT-5’를 공식 출시했다. 코딩, 수학, 글쓰기, 건강, 시각 인지 등 다양한 분야에서 이전 모

www.aitimes.kr

 

 

 

GPT-5는 각 분야별로 특화된 기존의 모델과는 달리 GPT-5 모델 하나가 코딩, 수학, 글쓰기, 시각인지 등 여러 분야에서 기존 모델을 뛰어넘는 성능을 보여주고 있으며 여러 벤치마크에서 기존의 기록을 뛰어넘음으로써 새로운 SOTA(Standard of the Art)를 달성하고 있다고 평가받고 있습니다.

또한 기존 모델에 비하여 환각(Hallucination) 현상을 획기적으로 줄이고, 기타 오류 발생륭의 감소안정성 및 안전성을 강화하였으며 각 분야에서 박사급의 전문성을 보이고 있음을 강조하고 있습니다.

 

출시외 동시에 각계각층으로부터 호평을 받고 있으나 한 편으로는 여전히 많은 오류가 나타나고 있음을 지적하는 경우도 늘어나고 있습니다.

실제로 단순한 연산 오류가 아직 수정되지 않고 잘못된 계산 결과를 제시한다거나, GPT-5 모델에게 GPT-5에 대한 질문을 했을때 GPT-5 모델은 아직 출시되지 않았다는.. 자신의 존재를 부정하는 모순이 발생한다거나.. 이런 다양한 문제가 여전히 드러나고 있습니다.

일부에서는 오히려 간단한 특정 벤치마크도 통과하지 못했다고 하거나, 기대이하이다.. 혁신적인 업데이트가 아니라 마이너 수준의 작은 개선에 지나지 않는다는 평가도 나오고 있습니다.

그러나 그런 문제들을 감안하더라도 대체로 현재까지 출시된 모델 중에서 가장 뛰어난 모델이라는 평가는 바뀌지 않는 모양입니다.

 

그런데 GPT-5의 출시와 함께 OpenAI가 미국 연방정부에 생성형 인공지능(AI) 서비스 'ChatGPT Enterprise'를 사실상 무료에 가깝게 제공하기로 하면서 정부 시장 내 주도권 확보에 나섰다는 소식이 들려왔습니다.

ChatGPT Enterprise 서비스를 미국 연방정부의 각 기관당 1년 사용료를 단돈 1달러에 제공한다는 소식입니다.

 

또한 챗GPT의 주간 활성 이용자 7억 명에게 GPT-5를 무료로 제공한다고 합니다.

 

https://news.sbs.co.kr/news/endPage.do?news_id=N1008210691&plink=MAINLIST&cooper=SBSMAIN

 

'박사급 AI' 7억 명에 무료 공개…벌어지는 격차

챗GPT를 만든 오픈 AI가 새로운 AI 모델인 GPT-5를 공개했습니다. 오픈 AI 최고 경영자인 샘 올트먼은 이번 모델이 박사급 전문가 수준이라며, 전 세계 7억 명 가입자에게 무료로 제공하기로 했습니

news.sbs.co.kr

 

ChatGPT에 접속하면 기존의 모델은 사라지고 GPT-5와 Plus만 나타난다.

 

 

그렇다면.. GPT-OSS와 GPT-5의 연이은 발표와 관련 정책은 미국 연방정부를 시작으로 유효 사용자 7억명까지.. AI 시장에 대한 GPT-5의 주도권 확보, GPT-OSS의 공개를 통한 산업계, 학계에 대한 주도권 확보가 목적이지 않을까요?

즉, 두 모델의 발표와 상기 정책을 묶어서 보면, OpenAI가 단순히 “좋은 모델을 만들었다”에서 그치는 것이 아니라 시장 지배력 강화 + 장기적인 플랫폼 잠금(lock-in) 전략을 동시에 추진하는 것으로 해석할 수 있습니다.

 

먼저 GPT-OSS를 공개함으로써 전 세계의 AI 스타트업, 연구자들이 초기 개발시에 자연스럽게 OpenAI의 생태계로 들어오도록 이끌고, 자사의 API 환경 만이 아니라 Hugging Face, 로컬 AI 환경에서도 OpenAI의 아키텍처에 익숙해지도록 유도함으로써 개발자와 연구자의 생태계를 자사 기술 기반으로 확장하고자 하는 것입니다.

 

그리고 GPT-5의 무료 제공을 통해 대중 시장을 장악하려는 것입니다.

무료 사용자가 많아질수록 시장에는 해당 모델에 의존하는 습관과 워크플로우가 형성되고, 장기적으로는 유료기능과 API, 부가 서비스(플러그인, 외부 데이터 연동, 에이전트 등)로 수익화가 가능해지게 되겠죠. 

 

또한 미국 연방정부에 대한 1년 1달러 정책을 통해 정책·공공기관 시장을 선점하고 표준으로서의 지위를 확보하며, 동시에 경쟁사를 견제하는 효과를 강화하는 목적이라고 할 수 있습니다.

 

결국 장기적으로 데이터와 사용패턴의 축적, 플랫폼의 종속(Lock-in), 정책 영향력 강화, 브랜드·인지도 독점이라는 성과를 확보하여 생태계와 표준을 사실상 OpenAI 중심으로 만드는 것이 목적이라고 생각됩니다.

 

이런 목적이 아닐까? (그림출처: 직접 그림)

 

 

AI 주도권을 잡기 위한 싸움은 벌써 치열하게 벌어지고 있습니다.

OpenAI 뿐만아니라 Google 및 다른 여러 회사, 여러 국가가 주도권을 잃지 않기 위하여 전력을 기울이고 있는 상황입니다.

 

비록 우리와 같은 개인 개발자/연구자의 입장에서는 할 수 있는 일이 크게 없겠지만 지금의 흐름을 잘 읽고 어느 한 쪽에 휘둘리지 않을 수 있는 방법을 찾아나가야 할 때라고 생각됩니다.

 

 

 

 

 

 

728x90
반응형