NC AI는 오픈소스 텍스트 모델을 기반으로 추가학습을 통해 멀티모달 모델을 구축하고, 최고 수준의 한국어 성능을 바탕으로 이미지와 텍스트를 함께 이해하는 능력을 갖춘 차세대 인공지능 모델을 선보였다.
바르코-비전 2.0 14B는 글로벌 오픈소스 비전언어모델(VLM) 최고 성능으로 알려진 140억 파라미터(InternVL3-14B)와 알리바바의 Ovis2-16B, Qwen2.5-VL 7B를 능가하는 성과를 달성했다. 4종의 모델 중 14B와 임베딩 모델 2종은 오늘, 1.7B와 OCR모델은 차주 중 공개 예정이다.

16일 공개된 14B모델의 경우 멀티모달 AI로 기존 최고 성능으로 알려진 InternVL3-14B, Ovis2-16B, Qwen2.5-VL 7B 등 동급 모델들을 영문 이미지 이해, 한국어 이미지 이해, OCR 벤치마크 등 다양한 벤치마크에서 능가하며, 멀티모달 AI에서도 소버린AI의 가능성을 확인했다.
NC AI는 개인과 산업의 활용도를 실질적으로 높이기 위해 14B 파라미터 모델과 함께 1.7B 파라미터 경량 모델을 동시에 제공한다. 14B 모델은 복잡한 멀티이미지 분석과 고도화된 추론이 필요한업무용 환경에 최적화돼 있으며, 1.7B 경량 모델은 스마트폰이나 PC 등 개인 기기에서도 원활하게 동작할 수 있도록 설계됐다.
이는 클라우드 환경 뿐만 아니라 개인 디바이스에서도 고성능 멀티모달 AI를 활용할 수 있게 함으로써 AI 기술의 접근성과 확장성을 크게 높인 것으로 평가된다.

NC AI는 이번 멀티모달 AI 모델 4종 공개를 통해 국내 AI 기술의 글로벌 경쟁력을 입증하는 동시에 오픈소스 생태계를 통한 기술 민주화에도 기여, 정부가 추진하는 ‘소버린AI’ 강화에 힘을 더할 계획이다.
특히 한국어 특화 성능과 실용적 활용성을 겸비한 이들 모델은 국내 다양한 산업 분야에서 AI 혁신을 가속화하는 촉매 역할을 할 것으로 예상된다.
이연수 NC AI 대표는 “기술 고도화로 글로벌 트렌드가 텍스트만 처리하는 언어모델을 넘어 비전 모델을 함께 활용하는 비전언어모델로 전환되고 있다”며 “이번 4종 모델 공개를 통해 미디어와 게임, 패션 등 버티컬 AI로 기존 국내 멀티모달 AI를 선도하는 NC AI가 비전언어모델에서도 한국의 주권을 지킬 수 있는 가능성을 확인했다”고 전했다.
[소비자가만드는신문=양성모 기자]