카카오가 차세대 자체 언어모델 ‘카나나-2’를 오픈소스로 공개하며 에이전틱 AI 구현을 위한 기술 경쟁력을 강조했다.
카카오는 글로벌 AI 오픈소스 플랫폼 허깅페이스에 카나나-2를 공개했다고 19일 밝혔다.
카나나 시리즈를 순차적으로 오픈소스로 선보여온 가운데, 이번 모델은 성능과 효율을 동시에 개선한 최신 버전이다.
카나나-2는 사용자 명령의 맥락을 이해하고 능동적으로 판단·행동하는 에이전틱 AI 구현에 초점을 맞췄다.
단순 질의응답을 넘어 단계별 지시를 수행하고 도구를 연계 활용하는 능력을 강화한 것이 특징이다.
이번에 공개된 모델은 베이스, 인스트럭트, 추론 특화 모델 등 3종으로 구성됐다.
특히 학습 과정에서 형성된 웨이트를 모두 공개해 개발자가 자체 데이터로 자유롭게 파인튜닝할 수 있도록 했다.
카나나-2는 에이전틱 AI의 핵심 요소로 꼽히는 도구 호출과 지시 이행 성능이 크게 향상됐다.
이전 모델 대비 다중 대화 기반 도구 호출 능력이 3배 이상 개선됐으며, 복잡한 단계적 요구 사항을 정확히 이해하고 수행하도록 설계됐다.
지원 언어도 한국어·영어에서 일본어·중국어·태국어·베트남어까지 확대됐다.
이어 기술 구조 측면에서는 효율성 강화를 위해 최신 아키텍처가 적용됐다.
긴 입력을 효율적으로 처리하는 MLA 기법과 추론 시 필요한 파라미터만 활성화하는 MoE 구조를 도입해 메모리 사용량과 연산 비용을 줄였다.
카카오는 향후 MoE 구조를 기반으로 모델 규모를 확장하고, 복잡한 에이전트 시나리오와 온디바이스 환경에 특화된 경량 모델 고도화를 병행할 계획이다.
카카오 관계자는 “실제 서비스 환경에서 빠르고 효과적으로 동작하는 실용적 모델을 지속적으로 오픈소스로 공유해 AI 생태계 활성화에 기여하겠다”라고 말했다.
한편 대규모 언어모델 경쟁이 치열해지면서, 최근 AI 기술의 핵심 화두는 단순한 ‘성능 향상’에서 ‘효율성 개선’으로 옮겨가고 있다.
먼저 MLA는 AI가 긴 문맥을 이해할 때 발생하는 ‘메모리 병목’을 줄이기 위한 기술이다.
기존 언어모델은 대화가 길어질수록 이전 모든 내용을 그대로 기억해 두어야 했고, 이 과정에서 GPU 메모리가 빠르게 소진됐다.
특히 AI가 한 단어씩 답변을 생성하는 추론 단계에서는 이 저장된 정보를 반복해서 불러오기 때문에 속도 저하와 비용 증가가 불가피했다.
MLA는 이 문제를 ‘압축’이라는 방식으로 해결하는데, AI가 모든 정보를 원본 그대로 저장하는 대신, 핵심만 뽑아낸 요약본 형태로 기억해 두는 구조다.
이후 필요할 때만 이를 다시 풀어 활용하기 때문에 AI는 긴 문장을 처리하면서도 메모리 사용량을 절반 가까이 줄일 수 있고, 처리 속도 역시 크게 개선된다.
이어 MoE는 모델 구조 자체를 효율화하는 기술이다.
일반적인 AI 모델은 하나의 거대한 두뇌가 모든 질문을 처리하지만, MoE는 여러 개의 ‘전문가’를 두고 질문에 따라 일부만 선택해 활용한다.
예를 들어 번역, 추론, 요약처럼 서로 다른 작업이 들어올 때, 해당 분야에 강한 전문가만 작동시키는 방식이다.
이 구조의 장점은 모델 전체 크기는 크지만, 실제 연산에 쓰이는 부분은 일부에 불과하다는 점이다.
덕분에 성능은 대형 모델 수준을 유지하면서도, 계산 비용과 전력 소모는 상대적으로 낮출 수 있다.
다시 말해 ‘똑똑하지만 항상 전력을 많이 먹는 AI’가 아니라, ‘필요할 때만 집중해서 일하는 AI’에 가깝다.
앞으로도 ‘AI를 얼마나 똑똑하게 만들 것인가’를 넘어, ‘AI를 얼마나 오래, 많이, 현실적으로 쓸 수 있는가’에 대한 기술이 주목을 받을 것으로 보인다.
![판교 카카오 사옥 [연합뉴스 제공]](https://images.jkn.co.kr/data/images/full/98/25/982541.jpg?w=800&h=0)






![[금융진단] 미 증시, 지정학 완화·빅테크 반등에 상승](https://images.jkn.co.kr/data/images/full/982892/image.jpg?w=288&h=168&l=50&t=40)

