SK텔레콤, LLM '에이닷 엑스 4.0' 공개…GPT-4o보다 한국어 능력 평가 점수 높아

2025-07-03     이범희 기자
SK텔레콤이 한국어에 최적화된 자체 개발 거대언어모델(LLM) ‘에이닷 엑스(A.X) 4.0’을 오픈소스로 공개하며 국내 기업 시장 공략에 나섰다. 이번에 공개된 모델은 한국어 능력 평가에서 오픈AI의 GPT-4o를 넘어서는 성능을 보였다.

SK텔레콤은 3일 글로벌 오픈소스 플랫폼인 허깅페이스(Hugging Face)를 통해 A.X 4.0의 표준 모델(72억 매개변수)과 경량 모델(7억 매개변수) 2종을 공개했다.

A.X 4.0은 중국 바이두의 오픈소스 모델 ‘Qwen2.5’를 기반으로, 방대한 한국어 데이터를 추가 학습시켜 국내 비즈니스 환경에 맞춘 성능을 구현한 것이 특징이다.
▲A.X 4.0의 대규모 학습(CPT)을 진행한 SK텔레콤 자체 구축 슈퍼컴퓨터 '타이탄'
SK텔레콤은 A.X 4.0에 자체 설계한 토크나이저를 적용해 한국어 처리 효율을 극대화했다. 자체 테스트 결과, 동일한 한국어 문장을 입력했을 때 A.X 4.0은 GPT-4o 대비 약 33% 더 높은 토큰 효율을 보였다. 이는 동일한 정보량을 더 적은 연산으로 처리할 수 있어, 비용 절감 측면에서도 경쟁력이 있다는 설명이다.

모델 성능은 벤치마크 지표에서도 확인됐다. 한국어 능력 평가 지표인 KMMLU에서 A.X 4.0은 78.3점을 받아 GPT-4o(72.5점)보다 우수한 성적을 기록했다. 한국 문화 이해도를 평가하는 CLIcK 벤치마크에서도 A.X 4.0은 83.5점을 받아 GPT-4o(80.2점)를 상회했다.

A.X 4.0은 온프레미스(On-Premise) 방식으로도 제공된다. 기업 내부 서버에 직접 설치할 수 있어 외부 네트워크와의 연결 없이도 작동 가능하며, 민감한 데이터 보호에 강점을 갖췄다. SK텔레콤은 A.X 4.0의 학습 전 과정(CPT)을 외부와 연동하지 않고 자체 데이터로 처리해 데이터 주권도 확보했다고 설명했다.

현재 SK텔레콤은 A.X 4.0을 자사의 AI 서비스 ‘에이닷’의 통화 요약 기능에 적용 중이다. 향후에는 SK텔레콤의 다양한 AI 기반 서비스는 물론, SK그룹 내 타 계열사 서비스에도 적용을 확대할 계획이다. 또한 A.X 4.0을 활용해 기업들이 자체 환경에서 파생형 LLM 개발이나 연구에 활용할 수 있도록 지원할 방침이다.

한편, SK텔레콤은 A.X 시리즈의 후속 모델도 순차적으로 공개할 예정이다. 이달 중 수학 문제 해결과 코드 개발 능력이 강화된 추론형 모델을 출시하고, 텍스트와 이미지를 동시에 이해·처리할 수 있는 멀티모달 모델도 개발 중이다. 기존 A.X 3.0에 적용했던 ‘프롬 스크래치(From Scratch)’ 방식도 유지해 소버린 AI 전략도 병행 추진하고 있다.

김지원 SK텔레콤 AI 모델 랩장은 "SK텔레콤의 다양한 서비스를 고도화하고 기업 시장에서 한국어 특화 LLM으로 국내 비즈니스 환경에 최적화된 모델이 될 수 있도록 지속적인 기술 개발을 추진할 계획"이라고 말했다.

[소비자가만드는신문=이범희 기자]