05월 29일(목)

팔로알토 네트웍스 “딥시크, 악성 콘텐츠 생성 취약”

팔로알토 네트웍스
(사진 출처-픽사베이)

글로벌 사이버 보안 기업 팔로알토 네트웍스 가 중국산 인공지능(AI) ‘딥시크(DeepSeek)’의 보안 취약점을 지적하며, 누구나 쉽게 악성 콘텐츠를 생성할 수 있는 위험이 있다고 17일 밝혔다.

팔로알토 네트웍스의 사이버 위협 연구 조직 ‘유닛42(Unit 42)’는 딥시크가 AI 모델 보호 장치를 우회하는 ‘탈옥(Jail Breaking)’ 공격에 취약하다는 조사 결과를 발표했다.

전문 지식이 없는 일반 사용자도 정교한 명령어(프롬프트)를 입력하면 유해한 콘텐츠를 생성하거나 부적절한 응답을 유도할 수 있다는 설명이다.

유닛42 연구진은 세 가지 탈옥 기법을 활용해 딥시크의 보안성을 테스트했다.

초기 응답에서는 큰 차이가 없었지만, 점진적으로 설계된 프롬프트를 입력하자 높은 확률로 우회가 가능해졌고, AI 가드레일이 무력화되는 문제가 발생했다.

팔로알토 네트웍스는 이와 같은 방식 외에도 알려지지 않은 새로운 탈옥 기법이 있을 가능성이 높다고 우려했다.

팔로알토 네트웍스는 기업이 거대언어모델(LLM)을 활용할 경우, ▲적절한 보안 가이드라인 설정 ▲승인되지 않은 제3자 AI 모델 사용에 대한 모니터링 강화 등의 대책이 필요하다고 강조했다.

필리파 콕스웰 팔로알토 네트웍스 유닛42 일본·아시아·태평양 부사장은 “기업들은 오픈소스 LLM을 사업 과정에 도입할 때 취약점을 반드시 고려해야 한다”고 언급했다.

이어 “향후 공격자들은 AI·LLM 기술을 더욱 정교하게 발전시키고, 궁극적으로 AI 기반 공격 에이전트까지 개발할 것으로 예상된다”고 경고했다.

다른기사보기

배동현 (grace8366@sabanamedia.com) 기사제보

답글 남기기