지금 미국 라스베가스에서 개최되고 있는 CES 2024의 내용을 살펴보면 산업 전반적으로 AI 기술이 휩쓸고 있다는 것을 알 수 있습니다.
특히 그 중에서도 LLM 기술을 기반으로 하고 있는 제품들이 대세를 이루고 있죠.
또한 AI, LLM을 기반으로 한 로봇들이 눈에 띄고 있는 것 같습니다.
삼성에서도 AI 컴패니언 로봇인 볼리(Ballie)를 발표하고 조만간 출시하겠다고 했다니 말이죠..
LLM 기술이 엣지 디바이스, 또는 온 디바이스라고 불리는 저성능의 단말에서도 널리 사용되기 시작하고 있다고 보면 될 것 같습니다.
그런데 저성능의 단말... 우리 같은 개인이 가진 저성능의 서버도 같은 처지라고 볼 수 있겠죠.
그러한 장비에서 LLM의 사용은 사실 하늘의 별 따기만큼 어렵다고 할 수 있습니다. ㅠㅠ
지난 글에서도 개인이 접근하기 어려운, 또 엣지 디바이스 등에서 적용하기 어려운 LLM 기술에 대항하여 sLLM(경량화 대형 언어 모델, samller Large Language Model)에 대하여 몇 번 언급한 적이 있습니다만, 이러한 sLLM도 최근 대세 기술로 오르고 있습니다.
특히 작년 12월10일에 작성했던 "Mistral 7B 모델"이라는 글에서 오픈소스로 사용할 수 있는 모델들에 대하여 이야기를 하기도 했습니다.
https://aidalab.tistory.com/201
그런데 그 글을 작성한 날로부터 이틀 후(2023년 12월 12일)에 Microsoft에서 "Phy-2"라는 sLLM 모델을 오픈소스로 발표하였습니다.
Mistral 7B 모델 보다도 더 작으면서 더 뛰어난 성능을 자랑한다고 밝혔었죠.
파라미터의 크기가 단 2.7B 밖에 되지 않으면서도 13B 크기의 Llama-2 보다 뛰어난 성능지표를 보여주고 있습니다.
(MS가 주장하는 비교 결과이긴 하지만요)
특히 Google에서 발표한 Gemini 모델에서 온디바이스 용으로 개발된 Gemini Nano 2 모델과 비교해도 훨씬 뛰어난 성능을 보이고 있다고 합니다.
한 가지 아쉬운 점은 오픈소스이긴 하지만 라이센스의 제한으로 인해 개인 연구용으로는 사용할 수 있어도 상업적으로는 사용할 수 없다는 점이었습니다.
그런데 사흘전, 그러니까 현지 시간으로 2024년 1월 6일자로 허깅페이스에 등록된 Phi-2의 라이센스가 MIT 라이센스로 바뀌었다고 합니다.
다시 말해서 상업용이건 뭐건 자유롭게 사용할 수 있다는 것입니다.
실제로 사용해 보면 어느정도의 성능을 보일지는 아직 잘 모르겠지만 우리같은 개인이 접근하기 용이한 모델이 이렇게 오픈되었다는 사실은 환영할 만한 일입니다.
점점 개인이 연구, 개발하기 좋은 환경들이 갖춰지고 있습니다.
(그래도 게으름을 피우다보면 언제 써볼지... 모르겠습니다만...ㅠㅠ)
'AI와 IT 이야기' 카테고리의 다른 글
Will GPT-4 run Doom? (0) | 2024.03.12 |
---|---|
Google Bard에도 그림을 그려주는 기능이 추가되었다. (0) | 2024.02.02 |
공감가는 기사 - 2024년 한국 인공지능은 위기다, 민(民)의 각성을 촉구한다(전자신문, 이경전 경희대 교수) (2) | 2024.01.05 |
"컴퓨터 언어 조기 교육"이 정말 중요할까? (0) | 2024.01.03 |
2024년은 인공지능이 인프라 수준으로 내려가기 시작하는 해가 될까? (0) | 2024.01.01 |