03월 18일(화)

IBM, 차세대 LLM 그래니트 3.2 선보여

IBM
(사진 출처-IBM 제공)

IBM 이 거대언어모델(LLM) 제품군의 차세대 버전인 ‘그래니트(Granite) 3.2’를 출시했다고 27일 밝혔다.

그래니트 3.2는 아파치 2.0 라이선스에 따라 허깅 페이스(Hugging Face)에서 사용 가능하며, 일부 모델은 IBM 왓슨x.ai(IBM watsonx.ai), 올라마(Ollama), 리플리케이트(Replicate), LM 스튜디오에서 즉시 이용할 수 있다.

또한, 곧 레드햇 엔터프라이즈 리눅스(RHEL) AI 1.5에서도 제공될 예정으로, 기업과 오픈 소스 커뮤니티에 새로운 AI 기능을 지원할 계획이다.

이번 그래니트 3.2 모델에는 ‘연쇄적 사고(Chain-of-Thought, CoT)’ 활성화 및 비활성화 기능이 도입됐다.

이를 통해 간단한 작업에서는 불필요한 연산 부하를 줄이고, 복잡한 연산이 필요한 경우 추론을 최적화할 수 있다.

특히 그래니트 8B 모델은 표준 수학 추론 벤치마크에서 대규모 모델과 동등하거나 이를 능가하는 성능을 보였다.

그래니트 3.2와 함께 ‘타이니타임믹서(TTM, TinyTimeMixers)’라는 차세대 시계열 모델도 공개했다.

이 모델은 1000만 개 미만의 매개변수로 최대 2년 후의 미래까지 장기 예측할 수 있는 기능을 갖췄다.

스리람 라가반(Sriram Raghavan) AI 연구 담당 부사장은 “다음 AI 시대는 기업이 과도한 컴퓨팅 비용 없이도 강력한 성과를 달성할 수 있는 효율성, 통합 가능성, 실용성이 화두가 될 것”이라고 언급했다.

이어 “개방형 솔루션에 중점을 둔 IBM의 최신 그래니트 모델은 오늘날의 기업들의 AI 접근성, 비용 효율성, AI 자체의 가치를 높이는데 있어 도움을 줬다고 생각한다”고 말했다.

다른기사보기

배동현 (grace8366@sabanamedia.com) 기사제보

답글 남기기