LG AI연구원, 초거대 AI '엑사원 2.0' 공개…학습 데이터 4배 늘렸다

2023-07-19     박인철 기자
LG AI연구원이 엑사원 버전 2.0을 공개했다. 2021년 12월 첫 선을 보인 ‘엑사원’의 진화한 버전이다.

LG AI연구원은 19일 서울 마곡 LG사이언스파크 컨버전스홀에서 ‘LG AI 토크 콘서트 2023’을 열고 초거대 AI ‘엑사원(EXAONE) 2.0’을 선보였다.

이번에 공개한 ‘엑사원 2.0’은 파트너십을 통해 확보한 특허, 논문 등 약 4500만 건의 전문 문헌과 3억5000만 장의 이미지를 학습했다.

LG AI연구원은 현존하는 전문 지식 데이터의 상당수가 영어로 되어 있는 점을 고려해 ‘엑사원 2.0’을 한국어와 영어를 동시에 이해하고 답변할 수 있는 이중 언어(Bilingual) 모델로 개발했고, 학습 데이터 양도 기존 모델 대비 4배 이상 늘려 성능을 높였다.  

또, 초거대 AI의 고비용 이슈를 해결하기 위해 대규모 언어 모델(LLM)과 멀티모달 모델의 경량화, 최적화 신기술에 상당한 리소스를 투입했다고 밝혔다.

LG AI연구원은 ‘엑사원 2.0’의 언어 모델은 기존 모델과 동일한 성능을 유지하면서도 추론(Inference) 처리 시간은 25% 단축하고, 메모리 사용량은 70% 줄여 비용을 약 78% 절감했다.

언어와 이미지 간의 양방향 생성이 가능한 멀티모달 모델은 이미지 생성 품질을 높이기 위해 기존 모델 대비 메모리 사용량을 2배 늘렸지만, 추론 처리 시간을 83% 단축해 약 66%의 비용 절감을 달성했다.

LG AI연구원은 고객들이 ‘엑사원 2.0’을 원하는 용도나 예산에 맞게 모델의 크기부터 종류(언어, 비전, 멀티모달), 사용 언어까지 맞춤형으로 설계할 수 있다고 설명했다.   

LG AI연구원은 고객 데이터 보안을 위해 학습 과정을 미세 조정하는 파인 튜닝(Fine-Tuning)과, AI 인프라를 고객이 보유한 서버에 직접 설치하는 구축형(On-Premise) 및 사설 클라우드(Private Cloud) 방식도 지원한다.
▲배경훈 LG AI연구원장
LG AI연구원은 대표적인 엑사원 활용 사례로 LG전자의 AICC(AI Contact Center, AI 컨택 센터)를 소개했다.

AICC는 고객과의 상담 내용을 실시간으로 분석·요약하고 상담 내용에 적합한 답변이나 콘텐츠를 제안한다.  

LG AI연구원은 국내에서 시범 운영 중인 AICC를 하반기 중 정식 서비스로 전환할 예정이며, 내년부터 영어권 국가로 확대할 계획이다.   

또 ‘전문가 AI’ 서비스 개발의 기반인 엑사원 3대 플랫폼인 유니버스(Universe), 디스커버리(Discovery), 아틀리에(Atelier)를 차례로 공개했다.

엑사원 유니버스는 ▲질의응답·대화 ▲텍스트 분류·요약 ▲키워드 추출·생성 ▲번역 등 기능별로 메뉴를 나눴던 방식에서 전문가용 대화형 AI 플랫폼으로 완전히 탈바꿈했다.
LG AI연구원은 엑사원 유니버스를 각 분야의 전문가들이 믿고 정보를 탐색하며 인사이트를 찾을 수 있는 플랫폼으로 만들기 위해 전문성과 신뢰성을 높이는 데 주력했다고 설명했다.  

엑사원 유니버스는 다른 대화형 AI들과 달리 사전 학습한 데이터는 물론 각 도메인별 최신 전문 데이터까지 포함해 근거를 찾아내며 추론한 답변을 생성한다.

또, 질문에 대한 답변과 함께 화면 좌측과 우측에 각각 질문과의 연관성이 가장 높은 전문 문헌들과 AI가 답변하는 과정에서 활용한 단락을 표시한다.

LG AI연구원은 이날 시연한 엑사원 유니버스의 AI/머신러닝 분야 서비스를 7월 31일부터 LG 그룹 내 AI 연구자, 협력 중인 대학을 대상으로 시작하며, 9월에는 LG에서 AI를 연구하거나 공부하는 임직원 대상으로 정식 서비스를 진행할 계획이다.

LG AI연구원은 화학, 바이오, 제약, 의료, 금융, 특허 등 엑사원 유니버스의 각 전문 도메인별 특화 서비스도 준비하고 있다.   

LG AI연구원은 이날 친환경 배터리 개발에 활용할 수 있는 첨가제 소재의 개발을 주제로 엑사원 유니버스와 엑사원 디스커버리를 연계해 AI에 질문하며 ▲전문 문헌 검토 ▲분자 정보 추출 ▲소재 구조 설계(UMD, Universal Molecular Design) ▲소재 합성 예측(NCS, Neural Chemical Synthesis) 등 후보 소재를 찾아내 합성 결과를 예측하는 과정을 시연했다.
LG AI연구원은 엑사원 디스커버리를 통해 1만회가 넘었던 합성 시행착오를 수십회로 줄이고, 연구개발 소요 시간은 40개월에서 5개월로 단축시킬 수 있을 것으로 예상했다.

LG AI연구원은 올해 4분기에 그룹 내 화학 및 바이오 분야 연구진들을 대상으로 엑사원 디스커버리 서비스를 제공할 예정이며, 이를 통해 신소재·신물질·신약 관련 연구개발에 혁신을 불러올 것으로 기대하고 있다. 

[소비자가만드는신문=박인철 기자]