본문 바로가기



AI와 IT 이야기

구글, 차세대 LMM "Gemini 1.0" 공개

어제 저녁에 급하게 뜬 기사에서 구글이 새로운 LLM(Large Language Model, 거대 언어모델)인 Gemini 1.0을 출시했다는 내용을 보았습니다.

Gemini 1.0은 LLM 중에서도 대형 멀티모달 모델이라는 의미로 LMM(Large Multi-modal Model)이라고 부르고 있습니다.
어떤 기사에서는 생성AI의 판도를 뒤집을 모델이라고 떠들고 있는 반면, 어떤 기사에서는 여전히 Open AI의 GPT-4를 넘어서기에는 부족하다고 평가하고 있습니다.
AI 전문가 그룹에서도 상당히 주목을 받고 있는 중이며 전문가의 지식 독점 시대가 저물기 시작하는 시대가 온다고 생각하는 분도 계십니다.

지난 번 구글에서 ChatGPT에 대항하여 Bard를 출시했을때 수많은 찬양 기사와는 달리 저의 개인적인 평가로는... 이전 글에서도 언급한 적이 있듯이 Bard가 ChatGPT에 비하여 많이 부족하다고 판단했었습니다.
이번에 발표한 Gemini는 과연 GPT-4를 뛰어넘을 수 있을지 궁금해지네요.

애초에 올 해 연말에 출시하기로 했다가 성능 문제 및 기타 이슈로 인해 내년 초에 출시할 예정이라고 변경했다가 다시 갑자기 출시를 진행한 것으로 보아..
아직 성능이건 뭐건 문제가 있는 것처럼 생각되네요.
아니면 어떤 문제가 해결되지 않아서 연기했는데 생각외로 빨리 해결되는 바람에 급히 출시를 진행한 것일 수도 있겠죠.

구글의 발표에 따르면 Gemini 1.0은 GPT-4를 뛰어 넘은 정교한 멀티모달 추론 기능을 갖추었고, MMLU(대규모 다중 작업 언어 이해)에서 90.0%의 점수를 받음으로써 86.4%의 점수를 받은 GPT-4를 능가했다고 합니다.
MMLU는 수학, 물리학, 역사, 법, 의학, 윤리 등 57개의 과목을 조합해서 언어의 이해와 추론 능력을 테스트하는 것으로 인간 전문가의 경우 89.8%를 기록했다고 하네요.
구글에서는 이처럼 인간의 점수인 89.8%를 Gemini 1.0이 넘어섬에 따라 Gemini 1.0이 인간 전문가를 뛰어넘은 LLM이라고 주장하고 있습니다.


그러나 Gemini 1.0이 완전히 GPT-4를 뛰어넘은 것은 아니고, 이번에 발표한 Gemini 1.0의 3가지 버전(Ultra, Pro, Nano) 중에서 Ultra 버전만이 90.0%를 받은 것으로 밝히고 있습니다.
Ultra 버전은 당분간은 정식 출시는 어렵고, Pro 버전은 Bard에 미세조정(Fine Tuning)을 적용하여 170개 이상 국가에서 영어에 한정하여 오늘부터 서비스를 제공한다고 합니다.
개발자들이 사용해 볼 수 있는 API는 12월 13일부터 구글 AI 스튜디오 또는 구글 클라우드 버텍스 AI의 Gemini API를 통해서 접속이 허용된다고 ㅎ네요.
Ultra 버전을 적용한 Bard Advanced 서비스는 내년 초에 출시 예정이라고 밝히고 있습니다.

Gemini 1.0의 성능이 어디까지 지원될지는 아직 모르겠지만 GPT-4의 독주를 견제할 수 있는 모델이 추가된 것은 좋은 의미로 받아들여도 될 것 같습니다.

 

 

 

여담으로...

Gemini를 발음할 때 "제미니"라고 부르는 곳도 있고 "제미나이"라고 부르는 경우도 있는데, "제미나이"와 "제미니" 모두 공식적인 올바른 발음입니다.(미국, 영국 동일)

그런데 저는 "제미니"가 더 맘에 드는데.. 국내 언론 및 전문가들은 "제미나이"를 더 많이 쓰는 것 같습니다.

"제미나이".... 는 왠지 어감이 좀 별로예요.

 

 

 

 

 

반응형