본문 바로가기

AI 관련 기술들/대형AI모델

Mistral 7B 모델

728x90

OpenAI의 GPT4, Google의 Gemini 1.0 등 최근 많은 LLM 또는 LMM이 출시되고 있습니다.
이러한 신 기술, 신 모델들이 빠르게 등장하고 활용되는 것을 보면 나도 저런 기술을 확보해야 할텐데.. 라는 생각이 들게 마련이죠.
그러나 현실적으로 시스템 요구사양부터 시작해서 많은 제약조건들이 점점 신기술의 확보를 어렵게 만들고 있습니다.
그러다보니 저런 서비스를 사용하는 것은 어찌어찌 한다고 하더라도(무료버전을 사용하든.. 유료버전을 사용하든..) 제대로 된 기술은 얻기 어려운 상황에 처하게 됩니다.
이렇게 점점 신기술의 일선에서 밀려나게 되는 거죠. ㅠㅠ
그래서 찾아보게 되는 것이 바로 오픈소스 LLM이 됩니다.
특히 상업적으로 사용해도 되는 라이센스를 가진 Llama2 라던지 최근 급격하게 인기를 끌기 시작한 Mistral AI와 같은 것들이 시선을 끌고 있습니다.
더구나 Mistral AI는 Apache 2.0 라이센스를 채택하고 있기 때문에 아무런 부담없이 활용할 수 있다는 장점을 가지고 있습니다.

Mistral AI는 생성형 AI 모델을 개발하기 위해 팀을 구성할 수 있게 해 주는 플랫폼입니다.

2023년, 즉 올해 설립된 동명(Mistral AI)의 회사에서 개발된 플랫폼으로 최근 LLM 을 무료로 제공하기 시작했습니다.
대표적인 LLM 모델은 Mistral 7B 모델이며 GPT4 등과 비교하여 엄청나게 적은 파라미터를 사용하는 sLLM 중에서도 소규모에 해당하는 모델입니다.
역시 소규모 모델인 Meta의 Llama2가 13B(130억개)의 파라미터를 사용하는 것에 비해 Mistral 7B는 7B(73억개)의 파라미터를 사용하고 있으니까 거의 절반의 크기인 셈이죠.
그러나 최근 Open Ko-LLM LeaderBoard에 따르면 여전히 Llama2가 가장 높은 순위를 차지하고 있긴 하지만 Mistral 7B의 인기가 빠르게 상승하고 있습니다.
또한 벤치마크 테스트의 결과, 동일한 수준의 크기를 가진 Llama 2 7B와 비교할때 Mistral 7B가 훨씬 뛰어난 점수를 받았다고 소개하고 있습니다.
뭐 자기들이 소개한 거라서 완전하게 믿기는 어려울지도 모르겠지만요.

Mistral 7B와 Llama 모델 벤치마크 테스트 결과 (그림출처: Mistral AI, https://mistral.ai/news/announcing-mistral-7b/)



그래도 지금까지 주로 한국, 미국, 중국을 중심으로 개발 및 서비스가 진행되던 LLM 분야에서 유럽(프랑스)도 발을 내밀기 시작했다고 볼 수 있겠네요.
그리고 Mistral 7B를 이용하여 개인 또는 소규모기업/스타트업에서 튜닝한 모델이 Open Ko-LLM LeaderBoard의 상위에 조금씩 모습을 드러내는 것을 보면 적어도 어느 정도(?)의 투자를 하면 개인도 접근할 수 있는 영역이 되기 시작한 것 같습니다.
시스템의 지원도 좀 필요하긴 하겠지만 그래도 손댈 수 없는 영역에서 손이 닿는 영역까지 다가온 것만으로도 충분히 감사할만한 상황이라고 봅니다.

저도 지금 하고 있는 작업에 sLLM을 적용해 볼 수 있을까..라는 기대를 해 봅니다.

 

 

 

 

 

 

728x90
반응형