04월 22일(화)

트웰브랩스, 차세대 영상 AI ‘페가수스-1.2’ 선보여

트웰브랩스
(사진 출처-트웰브랩스 제공)

트웰브랩스 가 자사의 영상 이해 인공지능(AI) 모델 ‘페가수스’를 고도화한 ‘페가수스-1.2’를 12일 공개했다.

지난해 11월 처음 선보인 페가수스는 800억 개의 매개변수를 가진 초거대 영상언어 생성 모델로, 긴 영상을 요약하거나 영상 기반 질의응답을 수행하는 기능을 제공한다.

이번 ‘페가수스-1.2’는 기존 모델보다 영상 분석 능력이 대폭 향상됐다.

화면과 음성을 동시에 분석해 텍스트로 변환하는 기능이 강화됐으며, 짧은 영상부터 1시간짜리 장편 영상까지 높은 정확도로 처리할 수 있다.

또한, 영상을 저장하고 재사용하는 기술을 적용해 한 번 처리한 영상은 이후 더 빠르고 경제적으로 분석할 수 있도록 개선됐다.

트웰브랩스는 이번 모델이 비전 인코딩 기술을 개선하고 알고리즘 최적화를 통해 효율성을 크게 높였다고 밝혔다.

기존 대규모 모델 방식과 달리 상대적으로 가벼운 모델 크기로도 우수한 성능을 구현한 것이 특징이다.

또한, 오픈AI의 챗GPT-4o 및 구글의 제미나이 1.5 프로보다 빠른 응답 속도와 낮은 비용을 제공한다고 설명했다.

페가수스-1.2는 다양한 산업에서 활용될 전망이다. 엔터테인먼트 분야에서는 영상 콘텐츠 분류 및 하이라이트 추출, 교육 분야에서는 강의 영상 요약 및 핵심 내용 정리에 활용될 수 있다.

또한, 보안 분야에서는 폐쇄회로(CC)TV 영상 분석 및 이상 징후 탐지에도 적용 가능하다.

이승준 트웰브랩스 최고기술개발자(CTO)는 “영상 이해를 위해서는 화면 속 객체들의 공간적 관계, 시간에 따른 변화, 전후 맥락 간의 복잡한 상호작용을 모두 파악할 수 있는 고도화된 AI 모델이 필요하다”며, “페가수스-1.2는 혁신적인 시공간 정보 이해 방식을 도입해 영상을 정확하게 이해하고 다양한 산업 현장의 요구사항을 충족시킬 수 있게 됐다”고 밝혔다.

다른기사보기

배동현 (grace8366@sabanamedia.com) 기사제보

답글 남기기