LG AI연구원이 독자 AI 파운데이션 모델을 집약해 개발한 ‘K-엑사원’을 공개했다.
LG AI연구원은 ‘K-엑사원’이 정부 독자 AI 파운데이션 모델 프로젝트 1차 평가에서 전체 평균 점수 72점을 기록하며 참여한 5개 정예팀 가운데 1위를 차지했다고 12일 밝혔다.
K-엑사원은 총 13개 벤치마크 테스트 가운데 10개 항목에서 1위를 기록했다.
이어 글로벌 AI 성능 평가 기관 ‘아티피셜 어낼리시스(Artificial Analysis)’의 인텔리전스 지수 평가에서는 32점을 받아 세계 7위에 올랐다.
오픈 웨이트 모델 기준 상위 10개 가운데 중국 모델이 6개, 미국 모델이 3개를 차지한 가운데, K-엑사원은 유일한 한국 모델로 이름을 올렸다.
LG AI연구원은 K-엑사원이 공개 직후 글로벌 오픈소스 AI 플랫폼 ‘허깅 페이스’의 글로벌 모델 트렌드 순위 2위에 올랐으며, 미국 비영리 AI 연구기관 ‘에포크(Epoch) AI’가 선정한 ‘주목할 만한 AI 모델’에도 포함됐다고 밝혔다.
K-엑사원은 고효율·저비용 설계를 통해 고가의 인프라 없이도 엔비디아 A100급 그래픽처리장치(GPU) 환경에서 구동 가능하도록 설계된 것이 특징으로, 하이브리드 어텐션 구조를 고도화해 메모리 요구량과 연산량을 엑사원 4.0 대비 약 70% 절감했다.
학습 어휘 수는 15만 개에 달해 기존 모델 대비 1.3배 긴 문서를 처리할 수 있으며 추론 속도는 약 150% 향상됐다.
국내 AI 모델 가운데 가장 긴 26만 토큰의 문맥을 한 번에 이해할 수 있어 A4 문서 기준 400장 이상의 정보를 처리할 수 있다는 설명이다.
특히 LG AI연구원은 자체 AI윤리위원회를 통해 K-엑사원의 안전성과 신뢰성을 검증했다고 강조했다.
저작권 문제가 있는 데이터는 사전에 식별해 제외하는 등 학습 데이터 전반에 대해 데이터 컴플라이언스 평가를 진행했다.
LG AI연구원 관계자는 “K-엑사원은 제한된 자원 환경에서도 독자적인 기술 설계를 통해 글로벌 거대 모델과 경쟁할 수 있음을 보여준 사례”라고 강조했다.
한편 이번 평가는 글로벌 AI 모델을 하나의 기준 위에서 비교하는 ‘인텔리전스 지수’ 결과로, 특정 과제나 단일 시험이 아니라 실제 활용 환경에서의 ‘종합 지능’을 계량화하는 데 초점을 맞추고 있다.
인텔리전스 지수는 에이전트 능력, 코딩, 과학적 추론, 일반 지식·언어 이해 등 네 개 영역을 각각 25% 동일 가중치로 반영한다.
툴 사용과 다단계 작업 수행 능력, 실제 코드 작성과 디버깅, 복합적인 과학 문제 해결, 환각 통제와 언어 이해력까지 포함해, AI가 현실 세계의 지식 노동을 얼마나 안정적으로 수행할 수 있는지를 종합적으로 평가한다는 점에서 기존 벤치마크와 구분된다.
특정 시험에서 높은 점수를 얻더라도, 다른 영역에서 취약할 경우 종합 점수는 제한적으로 반영되는 구조다.
특히 아티피셜 어낼리시스는 최근 버전 4.0에서 점수 스케일을 의도적으로 재조정했다.
이전 버전에서는 상위 모델 점수가 70점대 초반까지 올라가면서 성능 차이가 수치로 충분히 드러나지 않는 ‘포화’ 문제가 발생했기 때문이다.
이에 따라 실제 지식 노동에 가까운 고난도 과제와 복합 평가 항목을 추가하고, 점수 분포를 낮춰 현재 최상위 모델도 50점 이하에 위치하도록 설계했다.
이 기준에서 50점대는 현 시점에서 가장 높은 종합 지능을 갖춘 모델, 30점대는 글로벌 상위권 고성능 모델로 해석된다.
점수가 상대적으로 낮아 보인다는 인식 역시 이 지표의 특성을 고려할 필요가 있다.
인텔리전스 지수에서 이론적인 100점은 인간 전문가와 에이전트 시스템이 수행하는 상당수 고난도 지식 작업을 안정적으로 대체하거나 능가하는 수준을 상정한 상한선에 가깝다.
복잡한 코드 작성과 디버깅, 고급 과학·물리 문제 해결, 장문 문맥 이해와 환각 통제까지 거의 완벽에 가까운 성능을 요구하는 영역이다.



![[금융진단] 미 증시, 지정학 완화·빅테크 반등에 상승](https://images.jkn.co.kr/data/images/full/982892/image.jpg?w=288&h=168&l=50&t=40)

