김병학 카카오 성과리더 [출처= 카카오]
김병학 카카오 성과리더 [출처= 카카오]

카카오가 자체 개발한 AI 모델 ‘카나나(Kanana)’의 진화를 통해 차세대 에이전틱(Agentic) AI 시대를 준비하고 있다.

23일 열린 if(kakao)25 컨퍼런스에서 김병학 카카오 성과리더는 카나나 모델의 발전 방향과 구체적 비전을 공유하며, 인간과 AI의 자연스러운 소통을 목표로 한 옴니모달(Any-to-Any) AI 모델 전략을 제시했다.

앞서 카카오는 올해 2월 언어모델 라인업을 완성한 뒤 불과 석 달 만에 수학·코딩 등 고난도 문제 해결 능력을 대폭 강화한 Kanana-1.5를 공개했다. 이를 기반으로 MoE(Mixture of Experts) 구조와 추론(Reasoning) 모델을 연구하며 차세대 모델 Kanana-2 개발에 착수했다.

Kanana-2는 ▲복잡한 지시 수행 능력(Instruction Following) ▲외부 툴 활용 능력 ▲다국어 확장 ▲사실 기반 응답(Grounding) 강화에 중점을 두고 있다. 특히, 글로벌 최고 수준의 추론 효율성과 응답 속도를 목표로 하며, 경량 모델 최적화에도 집중해 다양한 규모에서 고성능을 구현할 계획이다.

김 성과리더는 “장기적으로는 지시 수행 모델(Instruct)과 심층 추론 모델(Reasoning)을 통합한 하이브리드 언어모델을 완성해 카카오 서비스에 최적화할 것”이라고 밝혔다.

카카오는 언어 이해를 넘어 멀티모달 이해와 생성으로 모델을 확장하고 있다. 이미지 생성 모델 ‘Kanana-kollage’, 동영상 생성 모델 **‘Kanana-kinema’**를 개발해 서비스 적용을 준비 중이다. 특히 Kanana-kinema는 인물 포즈 제어 기능을 추가해 더욱 자연스러운 영상을 생성할 수 있으며, 속도 최적화도 병행하고 있다.

향후에는 ‘Any-to-Any’ 옴니모달 모델로 진화해 텍스트·음성·이미지를 자유롭게 이해하고 생성하는 능력을 확보한다는 목표다. 이를 통해 ▲음성 기반 멀티턴 대화 ▲끊김 없는 실시간 대화(Full-duplex) ▲인간 가치와 일치하는 안전한 응답을 구현할 계획이다.

카카오는 올해 안에 최대 5개 언어를 지원하는 음성 모델을 추가하며 글로벌 확장에도 나선다. 김 성과리더는 “카나나 모델은 이용자의 마음을 먼저 읽고 스스로 도움을 주는 Agentic AI로 진화할 것”이라며 “국내 AI 생태계가 한 단계 도약하는 데 기여하겠다”고 말했다.

이번 발표는 카카오가 단순한 메신저 서비스 기업을 넘어, 고성능 자체 AI 모델을 기반으로 한 종합 AI 생태계 기업으로 도약하겠다는 의지를 드러낸 것으로 해석된다.

저작권자 © 이비엔(EBN)뉴스센터 무단전재 및 재배포 금지