오늘 네이버에서 상업용으로 사용이 가능한 sLLM인 HyperCLOVA X-SEED를 허깅페이스에 등록했습니다.
https://huggingface.co/naver-hyperclovax
naver-hyperclovax (HyperCLOVA X)
NAVER's generative AI, HyperCLOVA X, demonstrates exceptional Korean language understanding within the broader societal context. Its scalability and connectivity to the wider AI ecosystem enable the creation of novel user experiences and business opportuni
huggingface.co
해당 모델은 3B, 1.5B, 0.5B의 크기로 기존의 sLLM과 비교하더라도 매우 작은 크기를 가진 모델입니다.
MAU(Monthly Activity 1천만명 이하의 서비스기업이라면 상업용도로도 활용가능하다고 하니 매우 반가운 소식이네요.
성능은 아직 사용해보지 못한 상태라서 확신할 수 없지만..
네이버가 한동안 잠잠하더니 모처럼 좋은 모델을 던져주었습니다.
저 정도의 크기라고 한다면.. 모바일 폰이나 엣지 디바이스에서 충분히 작동할 수 있는 모델이 될 것으로 보입니다.
한국 최초의 상업용도 활용 가능한 sLLM이며 동시에 AI 생태계 동반성장을 위한 오픈소스 모델이라는 메시지가 더 반갑습니다.
이번에 등록된 3개의 모델 중 가장 작은 모델인 HyperCLOVAX-SEED-Text-Instruct-0.5B는 한국어와 한국어 문화에 대한 이해가 뛰어난, 명령어 수행 기능을 갖춘 Text-to-Text 모델이며...
비슷한 규모의 타사 모델과 비교할 때, 수학적 능력이 향상되고 한국어 능력이 크게 향상되었다고 하네요.
지금까지 HyperCLOVAX에서 출시한 모델 중 가장 작은 모델로, 엣지 디바이스와 같이 리소스가 제한된 환경에서 배포하기에 적합한 경량 솔루션이라는 특징, 강점을 가지고 있습니다.
최대 4K의 컨텍스트 길이를 지원하며 다양한 작업에 적용할 수 있는 다목적 소형 모델로 작동할 수 있는 모델이며... 단일 훈련 실행의 총 비용은 4.358K A100 GPU 시간(약 USD 6.537K)으로, 모델 훈련 비용보다 39배 저렴하다고 합니다.
트랜스포머 기반의 고밀도 모델을 채택하였고, 매개변수는 총 0.57 B에 0.45 B의 토큰 임베딩(타이드 임베딩 제외)을 가집니다.
크기가 크기인만큼 멀티모달은 아닌 텍스트-텍스트 모델이며...
지식 마감 날짜: 2025년 1월까지의 데이터에 대한 교육이 적용된 모델이라고 합니다.
반갑게도 점점 작은 모델들이 선을 보이고 있네요.
스마트폰이나 SBC를 활용한 LLM 앱도 만들어볼 만 합니다.
'AI & IT 이야기' 카테고리의 다른 글
오랜만에 사용해 본 ChatGPT (4) | 2025.04.11 |
---|---|
Meta, Llama4 제품군(Behemoth, Maverick, Scout) 발표 (4) | 2025.04.06 |
구글 "Gemini Code Assist" 무료 공개 (0) | 2025.02.26 |
월드 모델? 물리 AI? LLM은 사라질거라고? 글쎄.. (2) | 2025.02.02 |
DeepSeek 쇼크 이후 (4) | 2025.02.01 |