본문 바로가기



AI와 IT 이야기

MS의 sLLM인 Phi-2가 MIT 라이센스로 풀렸다.

 

지금 미국 라스베가스에서 개최되고 있는 CES 2024의 내용을 살펴보면 산업 전반적으로 AI 기술이 휩쓸고 있다는 것을 알 수 있습니다.

특히 그 중에서도 LLM 기술을 기반으로 하고 있는 제품들이 대세를 이루고 있죠.

또한 AI, LLM을 기반으로 한 로봇들이 눈에 띄고 있는 것 같습니다.

삼성에서도 AI 컴패니언 로봇인 볼리(Ballie)를 발표하고 조만간 출시하겠다고 했다니 말이죠..

LLM 기술이 엣지 디바이스, 또는 온 디바이스라고 불리는 저성능의 단말에서도 널리 사용되기 시작하고 있다고 보면 될 것 같습니다.

그런데 저성능의 단말... 우리 같은 개인이 가진 저성능의 서버도 같은 처지라고 볼 수 있겠죠.

그러한 장비에서 LLM의 사용은 사실 하늘의 별 따기만큼 어렵다고 할 수 있습니다. ㅠㅠ

 

지난 글에서도 개인이 접근하기 어려운, 또 엣지 디바이스 등에서 적용하기 어려운 LLM 기술에 대항하여 sLLM(경량화 대형 언어 모델, samller Large Language Model)에 대하여 몇 번 언급한 적이 있습니다만, 이러한 sLLM도 최근 대세 기술로 오르고 있습니다.

 

특히 작년 12월10일에 작성했던 "Mistral 7B 모델"이라는 글에서 오픈소스로 사용할 수 있는 모델들에 대하여 이야기를 하기도 했습니다.

https://aidalab.tistory.com/201

 

Mistral 7B 모델

OpenAI의 GPT4, Google의 Gemini 1.0 등 최근 많은 LLM 또는 LMM이 출시되고 있습니다. 이러한 신 기술, 신 모델들이 빠르게 등장하고 활용되는 것을 보면 나도 저런 기술을 확보해야 할텐데.. 라는 생각이

aidalab.tistory.com

 

그런데 그 글을 작성한 날로부터 이틀 후(2023년 12월 12일)에 Microsoft에서 "Phy-2"라는 sLLM 모델을 오픈소스로 발표하였습니다.

Mistral 7B 모델 보다도 더 작으면서 더 뛰어난 성능을 자랑한다고 밝혔었죠.

파라미터의 크기가 단 2.7B 밖에 되지 않으면서도 13B 크기의 Llama-2 보다 뛰어난 성능지표를 보여주고 있습니다.
(MS가 주장하는 비교 결과이긴 하지만요)

인기 있는 오픈 소스 SLM과 비교한 그룹화된 벤치마크의 평균 성능(출처:MS)

 

특히 Google에서 발표한 Gemini 모델에서 온디바이스 용으로 개발된 Gemini Nano 2 모델과 비교해도 훨씬 뛰어난 성능을 보이고 있다고 합니다.

벤치마크에서 Phi-2와 Gemini Nano 2 모델 비교(출처:MS)

 

한 가지 아쉬운 점은 오픈소스이긴 하지만 라이센스의 제한으로 인해 개인 연구용으로는 사용할 수 있어도 상업적으로는 사용할 수 없다는 점이었습니다.

 

그런데 사흘전, 그러니까 현지 시간으로 2024년 1월 6일자로 허깅페이스에 등록된 Phi-2의 라이센스가 MIT 라이센스로 바뀌었다고 합니다.

다시 말해서 상업용이건 뭐건 자유롭게 사용할 수 있다는 것입니다.

실제로 사용해 보면 어느정도의 성능을 보일지는 아직 잘 모르겠지만 우리같은 개인이 접근하기 용이한 모델이 이렇게 오픈되었다는 사실은 환영할 만한 일입니다.

 

허깅페이스 사이트에서 MIT 라이센스로 업데이트 된 내용을 확인할 수 있음(출처: 허깅페이스 사이트)

 

점점 개인이 연구, 개발하기 좋은 환경들이 갖춰지고 있습니다.

(그래도 게으름을 피우다보면 언제 써볼지... 모르겠습니다만...ㅠㅠ)

 

 

 

 

 

 

 

 

 

반응형