
국내 대표 인공지능 전문 기업 NC AI 가 멀티모달 AI 기술력 강화에 나섰다. NC AI는 16일, 한국어 기반의 멀티모달 AI 모델 4종인 'VARCO-VISION 2.0'을 오픈소스로 공개하며 AI 생태계 확장에 나선다고 밝혔다.
공개된 모델은 △14B 파라미터 고성능 모델 △1.7B 경량 모델 △OCR 특화 모델 △임베딩 모델로 구성됐다.
이 중 14B 모델과 임베딩 모델은 이날 공개되며, 나머지 두 모델은 차주 중 오픈 예정이다.
VARCO-VISION 2.0은 이미지와 텍스트를 동시에 이해하는 멀티모달 AI 모델이다.
복잡한 문서나 차트, 표 분석, 다중 이미지 비교까지 처리 가능하며, 한국어 텍스트 생성과 문화 맥락 이해 능력에서도 우수한 성능을 보여줬다.
특히 14B 모델은 글로벌 벤치마크에서 InternVL3-14B, Ovis2-16B, Qwen2.5-VL 7B 등 주요 비전언어모델을 앞서는 성능을 기록한 것으로 평가받고 있다.
한국어 이미지 분석, 문서 OCR 테스트 등 주요 항목에서 한국 기반 모델로는 최고 성과를 냈다.
이와 함께 NC AI는 다양한 활용 환경을 고려해 경량화된 1.7B 모델도 함께 선보인다.
이는 클라우드뿐만 아니라 개인용 디바이스에서도 구동이 가능하도록 설계되어, 접근성과 활용도를 동시에 확보했다.
OCR 특화 모델은 이미지 내 문자를 인식하는 데 초점을 맞춘 1.7B-OCR 모델로, 기존 방식과 달리 이미지와 텍스트를 함께 학습하는 구조를 채택했다.
한국어 텍스트 인식 정확도에서 기존 오픈소스 모델 대비 우위를 보였다.
임베딩 모델인 VARCO-VISION-Embedding은 이미지, 텍스트, 영상 데이터를 동일 임베딩 공간에서 정밀하게 분석해 의미적 유사도를 파악할 수 있도록 설계됐다.
검색, 추천, 콘텐츠 분석 등 다양한 분야에서 활용 가능성이 크다.
NC AI는 이번 4종 모델을 모두 연구 및 비상업적 목적의 오픈소스로 제공하며, 기업과 공공기관도 활용할 수 있도록 열어두었다.
이를 통해 국내 AI 기술의 자주성과 기술 주권을 강화하는 데 기여하겠다는 입장이다.
이연수 NC AI 대표는 “기술 고도화로 글로벌 트렌드가 텍스트만 처리하는 언어모델을 넘어 비전 모델을 함께 활용하는 비전언어모델로 전환되고 있다”고 말했다.
이어 “이번 4종 모델 공개를 통해 미디어와 게임, 패션 등 버티컬 AI로 기존 국내 멀티모달 AI를 선도하는 NC AI가 비전언어모델에서도 한국의 주권을 지킬 수 있는 가능성을 확인했다”고 덧붙였다.
배동현 ([email protected]) 기사제보




댓글을 남기려면 로그인 해주세요.