지금 미국 라스베가스에서 개최되고 있는 CES 2024의 내용을 살펴보면 산업 전반적으로 AI 기술이 휩쓸고 있다는 것을 알 수 있습니다.
특히 그 중에서도 LLM 기술을 기반으로 하고 있는 제품들이 대세를 이루고 있죠.
또한 AI, LLM을 기반으로 한 로봇들이 눈에 띄고 있는 것 같습니다.
삼성에서도 AI 컴패니언 로봇인 볼리(Ballie)를 발표하고 조만간 출시하겠다고 했다니 말이죠..
LLM 기술이 엣지 디바이스, 또는 온 디바이스라고 불리는 저성능의 단말에서도 널리 사용되기 시작하고 있다고 보면 될 것 같습니다.
그런데 저성능의 단말... 우리 같은 개인이 가진 저성능의 서버도 같은 처지라고 볼 수 있겠죠.
그러한 장비에서 LLM의 사용은 사실 하늘의 별 따기만큼 어렵다고 할 수 있습니다. ㅠㅠ
지난 글에서도 개인이 접근하기 어려운, 또 엣지 디바이스 등에서 적용하기 어려운 LLM 기술에 대항하여 sLLM(경량화 대형 언어 모델, samller Large Language Model)에 대하여 몇 번 언급한 적이 있습니다만, 이러한 sLLM도 최근 대세 기술로 오르고 있습니다.
특히 작년 12월10일에 작성했던 "Mistral 7B 모델"이라는 글에서 오픈소스로 사용할 수 있는 모델들에 대하여 이야기를 하기도 했습니다.
https://aidalab.tistory.com/201
그런데 그 글을 작성한 날로부터 이틀 후(2023년 12월 12일)에 Microsoft에서 "Phy-2"라는 sLLM 모델을 오픈소스로 발표하였습니다.
Mistral 7B 모델 보다도 더 작으면서 더 뛰어난 성능을 자랑한다고 밝혔었죠.
파라미터의 크기가 단 2.7B 밖에 되지 않으면서도 13B 크기의 Llama-2 보다 뛰어난 성능지표를 보여주고 있습니다.
(MS가 주장하는 비교 결과이긴 하지만요)
특히 Google에서 발표한 Gemini 모델에서 온디바이스 용으로 개발된 Gemini Nano 2 모델과 비교해도 훨씬 뛰어난 성능을 보이고 있다고 합니다.
한 가지 아쉬운 점은 오픈소스이긴 하지만 라이센스의 제한으로 인해 개인 연구용으로는 사용할 수 있어도 상업적으로는 사용할 수 없다는 점이었습니다.
그런데 사흘전, 그러니까 현지 시간으로 2024년 1월 6일자로 허깅페이스에 등록된 Phi-2의 라이센스가 MIT 라이센스로 바뀌었다고 합니다.
다시 말해서 상업용이건 뭐건 자유롭게 사용할 수 있다는 것입니다.
실제로 사용해 보면 어느정도의 성능을 보일지는 아직 잘 모르겠지만 우리같은 개인이 접근하기 용이한 모델이 이렇게 오픈되었다는 사실은 환영할 만한 일입니다.
점점 개인이 연구, 개발하기 좋은 환경들이 갖춰지고 있습니다.
(그래도 게으름을 피우다보면 언제 써볼지... 모르겠습니다만...ㅠㅠ)
'AI & IT 이야기' 카테고리의 다른 글
Will GPT-4 run Doom? (0) | 2024.03.12 |
---|---|
Google Bard에도 그림을 그려주는 기능이 추가되었다. (0) | 2024.02.02 |
공감가는 기사 - 2024년 한국 인공지능은 위기다, 민(民)의 각성을 촉구한다(전자신문, 이경전 경희대 교수) (2) | 2024.01.05 |
"컴퓨터 언어 조기 교육"이 정말 중요할까? (0) | 2024.01.03 |
2024년은 인공지능이 인프라 수준으로 내려가기 시작하는 해가 될까? (0) | 2024.01.01 |