
카카오 가 경량 멀티모달 언어모델과 MoE(Mixture of Experts, 전문가혼합) 구조의
언어모델을 동시에 오픈소스로 공개하며 자체 AI 모델 개발 역량을 다시 한번 입증했다.
24일 카카오는 자체 설계 기반의 인공지능 언어모델 ‘카나나-1.5-v-3b’와 ‘카나나-1.5-15.7b-a3b’를 글로벌 오픈소스 플랫폼 허깅페이스(Hugging Face)에 등록했다고
밝혔다.
이번 공개는 지난 5월 ‘카나나-1.5’ 시리즈 4종을 오픈소스로 배포한 데 이어 약 두 달
만의 추가 조치다.
카카오는 이를 통해 독자 개발 AI 모델의 실용성과 기술 자립 가능성을 동시에
확인시켰으며, 정부의 ‘독자 AI 파운데이션 모델 프로젝트’ 참여 기업으로서 국내 AI
기술 경쟁력 강화에 기여하겠다는 의지를 밝혔다.
공개된 경량 멀티모달 모델 ‘카나나-1.5-v-3b’는 이미지와 텍스트를 동시에 이해할 수
있는 구조로 설계됐으며, 한국어와 영어 기반 문서 이해 성능에서 GPT-4o 등 대규모
상용모델에 근접한 성능을 기록한 것이 특징이다.
특히 한국어 벤치마크 평가에서 유사 규모의 국내외 공개 모델 대비 가장 높은 점수를
기록했고, 지시이행 벤치마크에서는 국내 동급 멀티모달 모델 대비 128%의 성능을
나타냈다.
또 다른 공개 모델인 ‘카나나-1.5-15.7b-a3b’는 효율적인 연산 자원 활용을 위해 MoE
구조를 채택했다.
이 모델은 전체 15.7억 파라미터 중 동작 시 약 3억 파라미터만 활성화되도록 설계돼,
연산 비용을 줄이면서도 성능은 카카오의 기존 8B 모델 수준을 상회한다.
해당 모델은 ‘카나나-나노-1.5-3B’ 기반의 다층신경망(MLP) 업사이클링 기법을 활용해
개발됐다.
카카오는 이러한 모델 설계를 통해 대규모 연산 환경이 없어도 실서비스에 적용 가능한 고효율 AI 모델을 구현하고 있다고 설명했다.
특히 사용자 지시 수행, 복합 질의 해석, 추론 기반 응답 생성 등 ‘에이전트형 AI’로의
진화를 위한 핵심 요소들을 반영하고 있으며, 하반기에는 추론 특화 모델도 공개할
예정이다.
김병학 카카오 카나나 성과리더는 “이번 오픈소스 공개는 비용 효율성과 성능이라는
유의미한 기술 개발의 성과를 거둔 것으로, 단순한 모델 아키텍처의 진보를 넘어 서비스 적용과 기술 자립이라는 두 가지 측면의 목표에 부합하는 결과물”이라고 밝혔다.
배동현([email protected]) 기사제보




댓글을 남기려면 로그인 해주세요.