|
카카오는 카나나의 연구 성과를 담은 테크니컬 리포트를 아카이브에 공개했다고 27일 밝혔다. 또 언어모델 라인업 중 '카나나 모델 2.1B' 모델을 오픈소스로 깃허브에 배포했다. 카나나 나노 2.1B 베이스 모델과 인스트럭트 모델, 임베딩 모델이 오픈소스 커뮤니티인 깃허브를 통해 제공된다.
카나나 나노 2.1B는 연구자와 개발자가 활용하기 적절한 크기의 모델이자 온디바이스 환경에서도 활용 가능한 고성능의 경량 모델이다. 카카오 측은 비교적 작은 규모임에도 유사한 크기의 글로벌 모델에 견줄 만한 성능을 자랑한다고 말했다.
카카오는 이번 오픈소스 공개를 통해 AI 기술 접근성을 높이고자 하며 연구자와 개발자들이 해당 모델을 토대로 다양한 응용을 시도할 수 있도록 모델의 업데이트를 지속 지원할 계획이다.
아카이브에 공개한 기술 보고서는 매개변수와 학습 방법, 학습 데이터 등 세부 사항을 담아낸 AI 논문이다. 카카오는 이번 보고서에 다양한 크기에 이르는 카나나 언어모델 전체의 사전 학습부터 사후 학습까지 전 과정을 담았다. 카나나 모델 구조, 학습 전략, 글로벌 벤치마크에서의 성과도 확인할 수 있다.
카카오 LLM '카나나 플래그'는 지난해 말 학습을 완료했다. 카카오는 지난해 10월 개발자 콘퍼런스 '이프카카오'에서 공개한 카나나 언어모델 전체 라인업을 모두 구축하게 됐다.
카카오는 카나나 플래그에 대해 글로벌 최고 수준의 한국어·영어 성능을 달성한 모델이라고 설명했다. 한국어 성능을 평가하는 'LogicKor', 'KMMLU' 벤치마크에서 타 모델을 압도하는 처리 능력을 입증했다고 전했다. 영어 성능을 평가하는 'MT-bench', 'MMLU' 벤치마크에서도 경쟁 모델과 유사한 성과를 기록했다.
학습 자원 최적화를 통해 유사 크기의 모델 대비 50% 이상 비용을 절감하며 SOTA 수준의 효율성과 성능을 동시에 구현해냈다고 강조했다.
김병학 카카오 카나나 성과리더는 "이번 오픈소스 공개를 통해 국내 AI 생태계 활성화에 기여할 수 있을 것으로 기대한다"며 "앞으로도 효율과 성능 중심의 실용적이고 안전한 AI 모델을 개발해 가며 지속적 기술 혁신을 통해 AI 경쟁력을 강화해 갈 계획"이라고 말했다.