05월 25일(일)

카카오, 방언 변환 AI 카나나-o 선보여

카나나-o
카카오는 한국어 방언을 표준어로 변환하고 억양과 감정을 인식해 실시간 반응하는 AI 언어모델 ‘카나나-o’를 공개했다. (사진 출처-카카오 제공)

카카오는 제주와 경상도 방언을 표준어로 자연스럽게 변환하고 사람의 억양과 감정을 인식해 실시간으로 반응할 수 있는 인공지능 언어모델 ‘카나나-o’ 를 개발해 공개했다고 1일 밝혔다.

카카오는 이날 자사의 공식 테크블로그를 통해 통합 멀티모달 언어모델 ‘카나나-o’ 와 오디오 언어모델 ‘카나나-a’의 성능과 개발 과정을 소개했다.

카나나-o는 텍스트, 음성, 이미지 등 다양한 형태의 정보를 동시에 이해하고 처리할 수 있는 멀티모달 언어모델로, 국내에서 처음으로 시청각 데이터를 통합해 자연어로 해석할 수 있는 모델이라는 점에서 주목된다.

카카오는 모델 병합과 병합 학습을 활용해 시청각 정보와 텍스트 간 연관성을 강화하고, 이를 기반으로 카나나-o를 훈련시켰다고 설명했다.

카나나-o는 사용자의 억양, 말투, 목소리 떨림 등 음성 내 비언어적 신호를 인식하고, 그에 맞는 감정적 반응을 생성할 수 있도록 설계됐다.

이를 통해 사용자 요청에 감정적으로 공감하며 자연스럽게 대화를 이어가는 것이 가능하다.

특히 한국어의 복잡한 억양, 어미 변화, 방언 특성까지 학습해 제주도와 경상도 등 지역 방언을 표준어로 변환하는 기능도 탑재됐다.

카카나는 또한 스트리밍 기반의 음성합성 기술을 적용해 카나나-o가 실시간으로 자연스러운 음성을 빠르게 생성할 수 있도록 구현했다.

예를 들어 사용자가 ‘이 그림에 어울리는 동화를 만들어 줘’라고 말하면, 카나나-o는 사용자의 억양과 감정을 분석한 뒤 그에 어울리는 창의적인 이야기를 실시간으로 들려준다.

카카오는 카나나-o가 한국어와 영어 벤치마크 테스트에서 글로벌 수준의 AI 모델들과 유사한 성능을 기록했다고 밝혔다.

특히 한국어 기준 평가에서는 우수한 점수를 받았으며, 한국어 특화 인공지능 모델로서의 가능성을 입증했다는 점을 강조했다.

카카오는 향후 카나나-o가 실제 대화처럼 사람과 말을 주고받을 수 있는 수준으로 발전할 수 있도록 연구를 지속하겠다고 밝혔다.

다른기사보기

배동현 (grace8366@sabanamedia.com) 기사제보

답글 남기기