2026년 06월 06일 토요일

검색

Home 테크 카카오, 생성형 AI 안전 확보 위한 Safeguard 모델 3종 오픈

카카오, 생성형 AI 안전 확보 위한 Safeguard 모델 3종 오픈

카카오
카카오는 AI 안전성과 신뢰성 강화를 위해 자체 개발한 'Kanana Safeguard' 모델 3종을 오픈소스로 공개했다. (사진 출처-카카오 제공)

카카오 가 생성형 인공지능(AI) 서비스의 안전성과 신뢰성을 높이기 위해 자체 개발한 AI 가드레일 모델 ‘Kanana Safeguard(카나나 세이프가드)’ 3종을 오픈소스로 공개했다.

국내 기업 중 처음으로 AI 안전성 검증 모델을 무료로 배포하는 사례다.

카카오가 공개한 Kanana Safeguard는 자사 언어모델 'Kanana(카나나)'를 기반으로 한 AI 검증 모델로, 한국어와 한국 문화에 특화된 데이터셋을 활용해 정밀한 유해성 탐지 능력을 갖춘 것이 특징이다.

유해 콘텐츠의 검출 성능을 나타내는 F1 스코어 기준으로도 글로벌 AI 모델 대비 우수한 한국어 성능을 기록했다.

이번에 오픈소스로 제공되는 3종 모델은 다음과 같다. △혐오, 괴롭힘, 성적 콘텐츠 등 유해한 발화를 탐지하는 'Kanana Safeguard' △개인정보 유출이나 저작권 침해 등 법적 위험 요청을 차단하는 'Kanana Safeguard-Siren' △AI 시스템을 악용하려는 시도를 탐지하는 'Kanana Safeguard-Prompt'다.

세 모델은 모두 글로벌 오픈소스 플랫폼 허깅페이스를 통해 다운로드 받을 수 있다.

카카오는 해당 모델에 상업적 이용과 수정, 재배포가 가능한 아파치 2.0 라이선스를 적용해 누구나 자유롭게 사용할 수 있도록 했다.

향후 정기적인 업데이트를 통해 고도화된 검증 기능도 선보일 계획이다.

카카오 김경훈 AI 세이프티 리더는 “생성형 AI의 등장 이래 기술의 발전과 더불어 AI 윤리와 안전성에 대한 중요성이 국내외에서 점차 부각되고 있다"며 "책임감 있는 AI 구축에 대한 인식을 널리 확산시키고 사회적 가치를 고려한 기술 개발이 이어질 수 있도록 선제 대응을 이어갈 계획”이라고 밝혔다.

배동현 ([email protected]) 기사제보

ⓒ 2024–2026 이슈데이. 본 콘텐츠는 저작권법의 보호를 받으며, 무단 전재 및 재배포를 금합니다.

이슈 라인

오픈AI, 마지막 비추론형 AI GPT-4.5 공개

오픈AI 가 새로운 인공지능(AI) 모델 GPT-4.5를 공개했다. 이번 모델은 기존 GPT 시리즈의 연장선상에서 감성지능(EQ)과 패턴 인식 능력을 대폭 향상시킨 것이 특징이다. 27일(현지시간) 오픈AI는 GPT-4.5를 일부 사용자 대상으로 ‘리서치 프리뷰’ 방식으로 공개했다. 이는 지난해 5월 선보인 GPT-4o의 후속 모델로, 논리적 추론 없이도 창의적인 통찰을 생성하는 능력이 강화됐다. 오픈AI는 “지금까지 개발한 대화형 모델 중 가장 크고 강력하다”며, […]

“너구리 사냥 작전 개시”…수원FC, 1호선 더비 설욕 다짐하며 FC안양과 격돌

수원FC와 FC안양이 자존심을 걸고 다시 한 번 ‘1호선 더비’에 나선다. 지난 4월 FC안양에 1-3으로 패하며 자존심을 구긴 수원FC가 오는 14일 수원종합운동장에서 열리는 2025 하나은행 K리그2 18라운드에서 홈 팬들 앞에 복수전을 예고했다. 수원FC는 이번 경기를 상징적으로 ‘작전명: 너구리 사냥(Mission: Raccoon Down)’이라 명명하며 필승 의지를 불태우고 있다. 앞선 맞대결에서는 이재준 수원시장이 약속대로 FC안양 보라색 유니폼을 착용해 유쾌한 […]

알서포트, AI 회의록 서비스 ‘AI리포토’ 정식 출시

B2B IT솔루션 전문기업 알서포트 가 인공지능(AI) 기반 회의록 서비스 ‘AI리포토(AI:repoto)’를 정식 출시했다고 17일 밝혔다. ‘AI리포토’는 온·오프라인 회의 내용을 자동으로 기록·정리하는 기업용 AI 회의록 솔루션이다. 기업 규모나 IT 환경에 따라 구축형(On-premise) 또는 서비스형 소프트웨어(SaaS) 방식으로 제공되며, 2차 인증 기능을 지원해 보안성을 강화했다. 알서포트에 따르면 ‘AI리포토’는 독자적인 AI 파인튜닝 기술과 음성 텍스트 변환(STT) 기술이 적용되어 있으며, 자체 […]

홍석천, 극심한 통증 고백… '이 병'의 고통, 발가락까지 포기할 정도?

방송인 홍석천(53)이 통풍으로 겪은 극심한 고통을 솔직히 고백하며 통풍 질환에 대한 관심을 끌고 있다. 그는 21일 방송된 KBS 2TV '셀럽병사의 비밀' 예고편에서 "통풍에 걸렸을 때, 엄지발가락이 없어졌으면 좋겠다는 생각이 들 정도로 고통스러웠다"고 털어놨다. 그의 발언은 통풍이라는 질환의 심각성과 관리를 강조하는 계기가 되고 있다. 통풍은 관절과 주변 조직에 요산 결정이 침착되며 발생하는 만성질환이다. 요산은 음식에서 섭취되는 […]

현대백화점 하나은행 제휴 적금, 금리+상품권 혜택 제공

현대백화점 이 하나은행 과 손잡고 금리와 쇼핑 혜택을 모두 제공하는 새로운 적금 상품을 선보인다. 현대백화점 은 15일, 하나은행 과 업무협약(MOU)을 체결하고 '더현대 하나더' 적금을 출시한다고 밝혔다. '더현대 하나더' 적금은 기본적으로 연 4.0%의 우대금리를 제공하며, 만기 시 원금의 4%에 해당하는 금액을 현대백화점 상품권으로 지급하는 방식이다. 고객은 월 최대 100만원까지 6개월간 납입할 수 있으며, 단기간 내 높은 […]

더마베일 피부착색 관리 화장품 출시, 일본 병원 검증 거쳐 홈케어 시장 확장

기능성 화장품 브랜드 더마베일이 피부착색 관리 제품을 출시하며 시장 확대에 나섰다. 일본 병원 채널에서 제품력을 검증한 뒤, 일상 중심 홈케어 수요를 겨냥해 국내외 B2C 시장 공략에 속도를 낸다는 전략이다. 일본 병원 채널에서 제품력 검증 후 시장 확대 1년 이상 원료 개발 기반 기능성 제품 출시 시술 중심에서 일상 케어 중심으로 전략 전환 기능성 화장품 브랜드 […]

오버워치 탈론의 지배 공개 1년 대서사 시작

블리자드 엔터테인먼트는 오버워치의 대규모 서사 프로젝트 탈론의 지배를 공개하고 오버워치 프랜차이즈의 새로운 국면을 연다고 5일 밝혔습니다.  탈론의 지배는 오는 11일부터 약 1년에 걸쳐 진행되는 장기 프로젝트로, 영웅 추가와 스토리 확장, 신규 콘텐츠 업데이트를 통해 오버워치 세계관을 본격적으로 확장하는 데 초점을 맞췄습니다. 블리자드는 이번 프로젝트를 통해 연내 총 10명의 신규 캐릭터를 순차적으로 선보일 계획입니다.  11일에는 탈론 […]

신승훈 6회 한정판 선언, 35주년 매진 후 GS아트센터 재집결

싱어송라이터 신승훈이 한정판 콘서트로 팬들과 다시 만납니다.  그는 4월 10일부터 12일, 17일부터 19일까지 2주간 서울 강남구 GS아트센터에서 단독 공연 ‘2026 SHIN SEUNG HUN LIMITED EDITION’을 개최합니다. 이번 공연은 총 6회차로 구성됐습니다.  지난해 11월 진행된 데뷔 35주년 기념 콘서트 ‘2025 THE신승훈SHOW SINCERELY 35’가 빠르게 전석 매진되며 추가 무대를 요청하는 목소리가 이어졌고, 이에 화답하는 형태로 기획됐습니다. ‘LIMITED […]

스타 세일러 글로벌 파이널 테스트 12월 8일까지 진행

컴투스홀딩스가 신작 RPG 스타 세일러의 글로벌 파이널 테스트를 시작한다고 27일 밝혔습니다. 스타 세일러는 지난달 1만 명 이상이 참여한 글로벌 CBT를 성공적으로 마무리한 데 이어 이번 파이널 테스트를 통해 최종 완성도를 점검하는 절차에 돌입했습니다. 파이널 테스트는 27일 오전 11시부터 12월 8일까지 진행되며, 안드로이드 기반 베타 테스트 프로그램인 구글 OBT를 통해 제한 없이 누구나 다운로드해 참여할 수 […]