
비전 AI 전문기업 씨이랩 이 자체 개발한 기업용 비전언어모델 ‘VLM(Vision-Language Model)’을 공식 출시하며, 영상 AI 분석 분야에서 기술 고도화에 나섰다.
씨이랩은 이번 VLM 모델을 자사의 실시간 영상 분석 플랫폼 XAIVA(엑스아이바)와 클라우드 기반 서비스 VidiGo(비디고)에 본격 적용했다고 31일 밝혔다.
씨이랩이 개발한 VLM은 영상 데이터와 텍스트 데이터를 결합해 보다 높은 수준의 인지 및 분석 능력을 제공하는 AI 모델이다.
객체 분류, 자세 추정, 얼굴 인식 등 130종 이상의 비전 AI 알고리즘이 탑재돼 있으며, 산업 현장에서 실시간으로 이상 징후를 탐지하고 대응할 수 있는 기능을 제공한다.
VLM이 적용된 VidiGo는 대용량 영상 데이터를 분석해 요약하고, 문맥 기반 검색 기능을 지원한다.
사용자가 영상을 업로드한 뒤 질문이나 키워드를 입력하면 AI가 자동으로 필요한 장면을 탐색하고, 관련 내용을 영상 클립과 문서로 제공한다.
해당 기능은 미디어 기업과 공공기관 등 영상 데이터 활용도가 높은 고객군을 중심으로 납품 사례가 확대되고 있다.
또한 CCTV 기반 AI 영상 분석 플랫폼인 XAIVA에는 프롬프트 기반 이벤트 탐지 기능이 추가됐다.
예를 들어, “작업자 안전모 미착용”과 같은 문장을 입력하면, VLM이 이를 해석해 실제 영상 속 해당 상황을 실시간으로 감지하고 알림을 제공한다.
이 기능은 바이오, 반도체, 보안, 제조, 해양 산업 등 다양한 산업에서 품질 관리와 사고 예방 등에 활용되고 있다.
씨이랩은 앞으로 VLM을 디지털 트윈 환경과 연계해, AI가 감지한 이벤트에 따라 실제 장비를 제어하거나 시뮬레이션을 수행하는 ‘Physical AI’ 플랫폼 개발에 속도를 낼 계획이다.
이를 통해 AI가 인식, 판단, 제어까지 수행하는 자율형 지능 시스템을 구현한다는 목표다.
윤세혁 씨이랩 대표는 “AI가 스스로 인식하고 판단하며 행동까지 수행할 수 있는 'Physical AI' 시대를 준비하기 위해서는 AI가 영상을 정확히 이해하고 판단하며 자율적으로 행동할 수 있는 환경을 구축하는 것이 중요하다"며 "씨이랩의 VLM 기술을 중심으로, 기업에서 적용가능한 AI 솔루션을 지속적으로 확장해 나가겠다”고 말했다.
배동현([email protected]) 기사제보




댓글을 남기려면 로그인 해주세요.