오픈AI, ‘챗GPT 이미지’로 달리3 대체

오픈AI 가 자사 이미지 생성 인공지능(AI) 모델 ‘달리3’를 대체할 새로운 AI ‘챗GPT 이미지 제네레이션'(이하 챗GPT 이미지)을 공개했다.
챗GPT 이미지에는 생성형 AI 모델 GPT-4의 텍스트 이해 능력과 고급 이미지 생성 기술이 결합돼, 기존보다 훨씬 더 정교하고 정확한 이미지 제작이 가능하다.
오픈AI는 조만간 챗GPT 사용자들이 직접 이 기능을 활용할 수 있도록 서비스를 제공할 계획이다.
이번 발표는 25일(현지시간) 오픈AI가 한국 특파원들과 가진 브리핑에서 공개됐다.
챗GPT 이미지는 2023년 9월 공개된 달리3 이후 1년 6개월 만에 오픈AI가 선보이는 새로운 이미지 생성 모델이다.
달리3는 그간 사용자 요구를 완전히 반영하지 못한다는 평가를 받아 왔으며, 챗GPT 이미지는 이러한 한계를 극복한 진일보한 모델이라는 게 오픈AI의 설명이다.

오픈AI는 2021년 1월 첫 번째 달리 모델을 선보였고, 이후 2022년 4월 달리2를, 2023년 9월에는 달리3를 출시하며 꾸준히 기능을 업그레이드해왔다.
이번에 공개된 챗GPT 이미지는 기존 모델을 완전히 대체하는 독립형 이미지 생성 AI로, 달리3와는 근본적으로 다른 구조를 갖추고 있다.
다만 기존 사용자 편의를 위해 달리3는 일정 기간 병행 서비스될 예정이다.
오픈AI에서 멀티모달 업무를 담당하는 가브리엘 고는 “‘챗GPT이미지’는 ‘달리3’의 업그레이드 버전이 아닌 완전히 다른 이미지 생성 AI 모델이다”라고 강조했다.
챗GPT 이미지는 단순한 특수효과 생성 수준을 넘어, 실용적인 시각자료 생성 도구로 자리매김할 수 있도록 설계됐다.

챗GPT 이미지의 가장 큰 특징은 사용자의 복잡한 다단계 지시를 정확히 이해하고 반영할 수 있다는 점이다.
예를 들어 ‘파란색 별과 빨간색 삼각형’이라는 명령을 입력하면, 두 객체의 속성을 각각 올바르게 해석해 이미지로 구현해낸다.
오픈AI는 “‘챗GPT이미지’를 테스트한 결과 이 모델은 최대 15가지의 사용자가 원하는 물체를 정확하게 생성할 수 있는 것으로 나타났다”고 밝혔다.
이는 기존 달리3 모델보다 월등히 향상된 성능이다.
챗GPT 이미지는 또한 비현실적인 조합이나 상식 밖의 요청에도 대응할 수 있다.
오픈AI의 재키 새넌은 “‘챗GPT이미지’는 삼각형 바퀴가 달린 자전거를 그려달라는 프롬프트가 입력되면 ‘달리3’처럼 버벅되지 않고 삼각형 바퀴가 달린 이미지를 바로 생성해 낸다”고 설명했다.
나아가 정확한 텍스트 배치, 캐릭터 위치를 활용해 네컷 만화를 만들거나, 과학자의 기존 실험 이미지를 재창조하는 작업도 가능하다는 것이다.
실제 테스트에서 챗GPT 이미지는 교육용 포스터에 활용될 수 있는 8가지 고래를 정확한 색상으로 구현해내는 데 성공했다.
이를 바탕으로 오픈AI는 챗GPT 이미지가 교육이나 그래픽 자료 제작 분야에서도 널리 활용될 수 있을 것으로 기대하고 있다.

새넌은 “챗GPT 이미지로 AI는 단순히 재미있는 특수효과를 만들어 내지 않고 실용적인 도구가 될 것이다”라고 말했으며, “오픈AI가 누구나 쉽고 자세하고 정확한 시각 자료를 만들 수 있는 가능성을 열어서 기쁘다”라고 덧붙였다.
챗GPT 이미지는 오픈AI 이용자라면 누구나 챗GPT를 통해 무료로 사용할 수 있으며, 오픈AI의 동영상 생성 모델 소라(Sora)에서도 이 기술이 활용될 예정이다.
한국어 프롬프트에도 응답하지만, 영어만큼의 정확도를 확보했는지는 아직 불확실하다.
이에 대해 오픈AI는 “앞으로 한국어 등 다른 언어로도 ‘챗GPT이미지’가 정확하게 작동할 수 있도록 업데이트 해 나갈 것”이라고 밝혔다.
배동현 (grace8366@sabanamedia.com) 기사제보