2025.05.13 (화)

  • 구름많음동두천 17.6℃
  • 맑음강릉 20.3℃
  • 구름많음서울 18.2℃
  • 맑음대전 18.5℃
  • 맑음대구 19.0℃
  • 맑음울산 20.0℃
  • 맑음광주 18.4℃
  • 맑음부산 19.1℃
  • 맑음고창 18.4℃
  • 맑음제주 21.3℃
  • 구름많음강화 15.3℃
  • 구름조금보은 17.3℃
  • 맑음금산 18.1℃
  • 맑음강진군 18.7℃
  • 구름조금경주시 20.7℃
  • 맑음거제 19.7℃
기상청 제공

통신·IT·게임

카카오, if(kakaoAI)2024 통해 새로운 AI 모델 ‘카나나(Kanana)’ 라인업 공개

첫날 AI 서비스 ‘카나나’ 공개 이어 이튿날 기조세션 통해 다양한 AI 모델 패밀리 선보여
언어모델 외에도 멀티모달 언어모델, 비주얼 생성모델, 음성모델 등 전체 라인업 공개... 고성능, 투명성, 비용 효율 갖춰 설계
성능과 비용 효율 중심의 ‘카나나 에센스’ 모델 소개... 한국어, 영어에서 Top-Class 수준 기록
다양한 고성능 모델 지속 개발해 이용자 가치 높이고, AI 개발 생태계의 발전에 기여할 것
멀티모달 언어모델 ‘Kanana-o’, 비주얼 생성 모델 2종 등도 소개... “실질적 가치 제공하는 실용적 서비스로 구현되길 기대, 카카오 크루의 생산성 향상 위해서도 활용할 것”

 

카카오가 AI 서비스에 이어 고도화된 AI 모델들을 공개하며, 기술 및 서비스 분야에서의 AI 경쟁력 확보를 위한 성과와 계획을 공유했다. 


22일부터 3일간 개최중인 카카오의 개발자 컨퍼런스 ‘if(kakaoAI)2024’의 2일차인 23일, 카카오 김병학 카나나알파 성과리더는 기조 세션을 통해 “카카오는 AGI(인공일반지능)를 향한 글로벌 기업과의 경쟁에서 지속적인 도전을 이어가고 있으며, 카카오를 넘어 국내 전반에 기여할 수 있는 기반 마련을 위해 다양한 AI 모델을 개발하고 있다”고 말했다. 


카카오는 카나나 모델을 기반으로 이용자들에게 직접적인 도움을 줄 수 있는 AI 서비스화를 앞두고 있으며, 이를 위한 ‘서비스에 최적화된 LLM’은 좋은 성능, 비용 효율성, 튜닝을 통해 서비스의 문제를 해결하는 능력을 갖춰야 한다고 설명했다. 


서비스에 최적화된 LLM의 3가지 핵심 조건으로, 단순한 언어능력이 아닌 깊이 있는 상호작용을 이끌어내는 ’대화’ 능력과, 이용자에게 정확한 지식과 통찰력을 바탕으로 답변을 제공하는 ’지식’, 그리고 대화의 흐름을 읽고 대화에서 ‘연결’된 액션을 취할 수 있어야 한다고 말하며 카카오의 서비스에 새로운 가치를 더할 수 있을 것이라고 언급했다.


새로운 통합 AI 브랜드인 ‘카나나(Kanana)’는 카카오의 AI 모델명으로도 적용된다. 현재 카나나 모델들은 언어모델(LLM) 3종과 멀티모달 언어모델(MLLM) 3종, 비주얼 생성모델 2종과 음성모델 2종으로 크기나 종류, 특성에 따른 하위 모델들과 함께 전체 라인업이 구성된다. 


김 성과리더는 카나나 모델의 핵심적인 특징으로 한국어와 처리에 있어 탁월한 고성능을 보유했다는 점과, 신뢰할 수 있는 데이터로 학습해 투명성을 갖췄다는 점, 서비스 최적화에 맞춘 비용 효율적 모델이라는 점을 꼽았다. 


Kanana ‘Nano’-‘Essence’-‘Flag’까지 다양한 사이즈의 LLM 갖춰... 한국어 논리 및 추론서 글로벌 모델 대비 우위 보인 카나나 에센스 성능 비교 공개


카카오가 보유한 언어모델 중 가장 최적화된 모델 사이즈의 카나나 에센스(Kanana Essence)’는 정제된 데이터의 학습과 최적화된 모델 크기로 탁월한 성능과 비용 효율성을 보여준다. 특히, 저작권이나 개인정보 이슈가 해소된 고품질 데이터를 기반으로 필터링과 데이터 큐레이션 등의 전처리 작업을 진행했으며, 이를 통해 독자적 고품질 데이터셋를 구축했다. 이후 3차례의 멀티 스테이지 학습을 통해 유효한 성능을 내는 방법들을 병합하고, 고성능의 카나나 에센스 모델로 발전시키게 됐다. 


카나나 에센스 모델은 현재 글로벌 최고 성능을 가진 유사 사이즈의 대표 모델과의 성능 비교에서 유사하거나 높은 성능을 보이는 것으로 나타났다. 특히, 한국어 논리 및 추론을 평가하는 KMMLU, HAE-RAE 벤치마크에서 확실한 우위를 보였다. 이 밖에 모바일 디바이스에서도 활용 가능한 초경량 모델인 ‘카나나 나노’ 역시 유사 사이즈의 글로벌 대표 모델들과 비교했을 때 전반적인 벤치마크에서 평균적으로 탁월한 성능을 보였고, 한국어 성능에서도 압도적 성능을 나타냈다.


한편 베이스 모델이 만들어진 후 이용자의 지시를 명확히 이해하고 따를 수 있는 인스트럭트 모델(Instruct model) 개발에 대해서도 설명했다. 모델의 성능을 한층 높이고 Safety Alignment 과정을 거쳐, 이용자에게 해를 끼칠 수 있는 정보를 사전 차단해 안전하고 신뢰있는 답변을 제공할 수 있다. 인스트럭트 모델 역시 다양한 분야의 벤치마크에서 글로벌 모델들과 비교한 결과, 평균적으로 높은 성능을 보였다. 현재 인스트럭트 모델에서 보다 서비스에 특화된 방향으로 능력치를 향상시키기 위해 추가 훈련 과정을 거쳐, RAG, Function call, 요약 등과 같이 태스크에 특화된 전용 모델을 개발 중이라고 언급하며, 전용 모델의 높은 성능에 대한 가능성을 예고하기도 했다. 


카카오는 현재 가장 큰 사이즈인 카나나 플래그(Kanana Flag) 모델이 현재 학습 중에 있으며, 성능 좋은 모델을 만들 수 있는 노하우를 보유하게 된 만큼 지속적인 경쟁력 우위를 위해 노력하겠다고 밝혔다. 또한 최적화된 다양한 고성능 모델을 지속적으로 개발해 이용자 가치를 높이고, AI 개발 생태계의 발전에 기여할 수 있도록 힘쓰겠다고 말했다. 


멀티모달 언어모델, 비주얼 생성모델, 음성모델 등도 소개... 서비스 적용 뿐 아니라 내부 업무 생산성 도모 위해서도 활용 예정


카카오가 보유한 멀티모달 언어모델은 총 3가지로, 이날 세션에서는 Text와 Audio, Vision 데이터를 이해하는 모델을 넘어 ‘Omni’ 형태로 진화중인 ‘Kanana-o’ 모델을 중심으로 소개했다. ‘Kanana-o’ 는 음성인식, 텍스트, 음성합성 등의 모델을 각각의 필요에 따라 모듈식으로 결합하여 사용했던 기존의 구조에서 벗어나, 여러 모달리티의 데이터를 통합적으로 처리하는 형태로 개발됐다. 다양한 형태의 데이터를 동시에 이해해 빠르게 결과를 생성하는 구조를 갖춰, 텍스트와 오디오를 함께 생성하며 어떤 질문을 하던 평균 1.6초의 속도로 빠른 답변을 출력해준다. 실제 이용자와 자연스럽게 상호작용하는 데모 영상을 공개하기도 했다. 궁금한 사물을 카메라로 비추어 실시간 대화하는 형태로도 발전할 예정이다. 


해당 모델은 이미지 이해 성능 평가 시 자체 구축한 한국어와 한국 문화에 특화된 한국형 벤치마크에서 글로벌 모델 대비 높은 성능을 기록했고, 음성 성능 평가에서는 근소한 성능 우위를, SQA(Spoken Question Answering) 벤치마크에서는 월등히 높은 정확도를 보였다. 향후 이미지와 오디오 뿐만 아니라, 영상 데이터를 이해하고 이미지와 영상도 생성할 수 있는 통합 멀티모달 언어모델 구조로 진화할 예정이다. 


마지막으로 이미지와 영상 생성이 가능한 카나나의 비주얼 생성 모델 2종에 대해서도 공유했다. 이미지 생성모델 ‘Kollage by kanana’와 동영상 생성모델 ‘Kinema by kanana’ 중 동영상 생성모델의 구조에 대해 설명하며, 텍스트 입력부터 이미지 그리고 개인 프로필 사진까지 다양한 입력을 처리하는 형태로 개발 중이라고 밝혔다. 입력된 이미지를 바탕으로 단순히 영상을 생성하는 것을 넘어, 간단한 마우스 조작만으로 카메라와 캐릭터의 움직임을 쉽게 제어할 수 있게 되고, 이를 통해 풍부하고 다채로운 비디오 콘텐츠를 제작할 수 있다.


김 성과리더는 세션을 마무리하며 “기술의 가치는 서비스로 연결되어 이용자의 문제를 직접적으로 해결해주고, 실질적 가치를 제공해주는 실용적인 서비스로 구현되어야 빛을 발한다고 생각한다”고 말했다. 카카오는 이날 소개한 다양한 카나나 모델들을 토대로, 카카오의 AI 서비스에 적용하는 것 외에도 카카오 크루들의 생산성을 향상을 도모해 ‘AI Native’ 컴퍼니로 나아가기 위한 기반을 확대하겠다고 밝혔다.





레저·여행·음식

더보기