대회는 우리말 인공지능(AI) 언어모델의 개발 역량 향상과 국어 정보화 저변 확대를 위해 마련됐다.
9월 1일 오후 SKT의 기본 AI 언어모델과 국립국어원의 평가 데이터 세트 공개와 함께 시작되며, 참가자들은 15일부터 11월 1일까지 결과물을 수시로 업데이트하여 제출할 수 있다.
이번 대회는 개인 또는 팀으로 누구나 참가할 수 있다. 참가팀 중 대상(문화체육관광부 장관상), 금상·은상·동상, 특별상을 선정할 계획이며, 수상자 전원에게는 매년 SKT가 개최하는 AI Fellowship의 서류 심사 면제 특권도 제공할 계획이다.

제출된 언어모델을 평가하는 과제는 4가지로, 문장의 문법 오류 판단하기(문장 적법성 판단), 맥락별 단어 의미 구별하기(동형이의어 구별), 문장 읽고 원인 추론하기(인과 관계 추론), 제시문 읽고 질문에 예/아니오 답하기(판정 의문문) 등이다.
이번 평가는 지금까지 한국어 인공지능 모델 평가를 위해 공개된 데이터세트들보다 난이도가 다소 높은 내용으로 구성됐다. 제공하는 언어모델은 매개 변수가 12억 개인 모델로, 2020년 공개한 KoGPT2 모델보다 약 8배 크다.
이 모델은 SKT와 국립국어원이 연구 중인 한국어 범용언어모델(GLM) 과제의 초기 산출물이다. 기존에 SKT가 개발해 발표한 KoBERT, KoGPT2, KoBART 모델에 이어 한국어 AI 모델을 개발·활용하고자 하는 이들에게 도움이 될 것으로 전망된다.
[소비자가만드는신문=최형주 기자]