2026년 06월 04일 목요일

검색

Home 테크 TTA, 유해표현 검출 AI로 LLM 데이터 품질 혁신

TTA, 유해표현 검출 AI로 LLM 데이터 품질 혁신

TTA
(사진 출처-TTA 제공)

한국정보통신기술협회(TTA)가 대형언어모델(LLM) 학습용 데이터의 유해표현을 검출할 수 있는 인공지능(AI) 모델을 개발했다고 3일 밝혔다.

해당 모델은 한국지능정보사회진흥원(NIA)의 ‘2024년 초거대AI 학습용 데이터 품질검증 사업’의 일환으로 제작됐다.

TTA가 개발한 유해표현 검출 AI모델은 말뭉치 데이터에 포함된 문장의 유해성을 분석해 유해표현 여부를 판단하고, 해당 표현이 있으면 이를 카테고리별로 분류한다.

유해표현 유형은 국가인권위원회의 혐오표현 정의와 '혐오표현대항 안내서'를 참고해 3가지 유형과 11개 세부 카테고리로 설정됐다.

이 모델은 비속어가 아닌 문맥상 유해한 표현도 검출 가능하도록 설계됐다.

TTA는 개발한 모델과 학습 데이터를 AI 오픈소스 플랫폼 허깅페이스(Hugging Face)에 업로드했다.

이를 통해 누구나 API를 활용해 말뭉치 데이터의 유해성을 분석하고 유해 표현을 정제할 수 있다.

사용자는 KcELECTRA 및 KoBERT 등 다양한 Fine-Tuning 버전 중에서 선택해 활용 가능하다.

AI 서비스의 신뢰성과 안전성 확보가 중요한 가운데, 이번 AI모델은 생성형 AI 학습 데이터의 품질을 높이고, 윤리적 문제 발생을 줄이는 데 기여할 것으로 기대된다.

손승현 TTA 회장은 "최근 다양한 분야에서 생성형 AI 기술이 활발히 적용되면서, LLM 학습용 텍스트 데이터에 대한 수요가 급증하고 있으며, 이에 따라 LLM 기술의 윤리적 측면에 대한 사회적 관심도 높아지고 있다. 특히, 모델은 배운 대로 텍스트를 생성하기 때문에 학습용 텍스트에 포함된 유해 표현을 정제하는 과정이 반드시 필요하다"고 강조했다.

다른기사보기

배동현 ([email protected]) 기사제보

ⓒ 2024–2026 이슈데이. 본 콘텐츠는 저작권법의 보호를 받으며, 무단 전재 및 재배포를 금합니다.

이슈 라인

아동 식사 7700건 지원했더니…편의점 줄고 음식점 늘었다

취약계층 아동 식사 지원 사업에서 식사 질 변화가 확인됐다. ‘건강밥상’ 캠페인을 통해 음식점 이용이 늘고 편의점 의존은 줄어든 것으로 나타났다. 건강밥상 캠페인 성과…식사 7700건 지원 한국건강관리협회와 영등포구, 나눔비타민이 공동 추진한 ‘뿌기·또기의 건강밥상’ 캠페인이 마무리됐다. 이번 사업은 방학 기간 중 취약계층 아동 558명을 대상으로 약 1억 4000만 원 규모로 진행됐다. 여름과 겨울 운영을 합쳐 총 7733건의 […]

오픈AI, GPT-5로 생성형 AI 성능 새 기준 제시

오픈AI 가 7일(현지시간) 차세대 플래그십 인공지능 모델 ‘GPT-5’를 공식 출시했다. 생성형 AI ‘챗GPT’로 세계적인 주목을 받은 오픈AI는 이번 모델을 자사 역사상 가장 똑똑하고 유용한 AI라고 소개하며, 이전 세대 모델 대비 한층 향상된 정확성과 추론 능력을 강조했다. 오픈AI 는 GPT-5가 사용자의 요청에 보다 정교하고 안전한 답변을 제공하도록 설계됐다고 밝혔다. 단순히 요청을 거부하는 대신, 가능한 한 사용자의 […]

서해안고속도로 연쇄 추돌…차량 20여 대 충돌 사고

서해안고속도로 서울 방향에서 차량 20여 대가 부딪히는 대형 연쇄 추돌사고가 발생했다. 9일 오후 3시 29분 전북 부안군 줄포면 서해안고속도로 94.9㎞ 지점에서 차량 다중 추돌사고가 일어났다. 이 사고로 5t 트럭을 운전하던 30대 남성이 의식장애와 다리 부상을 입어 병원으로 이송됐다. 사고 당시 부안 지역에는 오전 8시 40분을 기해 대설경보가 발효된 상태였다. 도로에 쌓인 눈과 미끄러운 노면이 연쇄 […]

[KBL] 서울 삼성 서울 SK 2월 17일 페인트존 수비와 전환 속도 대결

경기분석 ✅ 프리뷰 이 경기는 하프코트 수비 완성도를 중시하는 흐름과 빠른 트랜지션을 기반으로 한 공격 농구의 대비로 정리됩니다. 서울 삼성은 비교적 안정적인 세트 디펜스를 바탕으로 페인트존을 단단히 잠그는 운영을 선호하며, 공격에서는 리바운드 이후 템포를 조절해 효율적인 전개를 가져가는 팀입니다. 반면 서울 SK는 수비 성공 이후 빠르게 전개되는 트랜지션 공격 비중이 높고, 코트 전반을 넓게 활용해 […]

국립합창단, 3·1절 기념음악회 ‘거룩한 함성, 그날 이후…’ 공연

국립합창단이 제106주년 3·1절을 맞아 창작 기념음악회를 무대에 올린다. 국립합창단은 오는 3월 1일 서울 예술의전당 콘서트홀에서 3·1절 기념음악회 ‘거룩한 함성, 그날 이후…’를 공연한다고 26일 밝혔다. 이번 작품은 지난해 3·1절을 기념해 초연된 창작 레퍼토리로, 합창과 독창, 배우의 연기와 내레이션, 관현악을 결합한 복합 무대 형식으로 구성됐다. 이야기는 일제강점기를 살아간 인물 정옥분의 삶을 중심으로 전개된다. 작품은 개인이 겪는 고통과 […]

광역버스 좌석예약제 확대…수원·용인·성남 등 운행 횟수 증가

국토교통부 대도시권광역교통위원회는 오는 8월 11일부터 수도권 광역버스 좌석예약제를 기존 65개 노선에서 68개 노선으로 확대 시행한다고 29일 밝혔다. 광역버스 좌석예약제는 모바일 앱을 통해 이용자가 정류소와 시간을 사전에 지정하고 좌석을 예약한 뒤, 지정된 시간에 줄을 서지 않고 바로 탑승할 수 있는 제도다. 이번 확대는 특히 출퇴근 시간대 혼잡이 심한 노선을 중심으로 이루어진다. 전체 65개 노선 중 31개 […]

‘꼬북칩 양념치킨맛’, 한미 동시 출격…오리온, 글로벌 K스낵 정조준

오리온이 자사의 대표 스낵 ‘꼬북칩’에 양념치킨이라는 한국의 인기 메뉴를 접목한 신제품을 한국과 미국에 동시에 출시하며 글로벌 K스낵 시장 공략에 나섰다. 한국과 미국 동시 출시 사례는 이번이 처음으로, K푸드 트렌드와 꼬북칩의 글로벌 입지를 동시에 겨냥한 포석이다. ‘꼬북칩 양념치킨맛’은 2017년 첫 선을 보인 후 전 세계에서 약 5000억 원의 누적 매출을 기록한 꼬북칩 브랜드에 새로운 바람을 불어넣을 […]

‘2025 양양 하조대 로드 페스티벌’, 마을 전체가 무대로…8일간의 ‘로컬 문화 실험’ 시작

강원도 양양군 하조대 일대가 오늘(9일)부터 16일까지 단순한 축제를 넘어선 새로운 문화 실험에 돌입한다. ‘2025 양양 하조대 로드 페스티벌(More than Paradise)’은 하조대 마을 전역을 하나의 공연장, 체험 공간으로 탈바꿈시키는 이례적인 시도로, 지역과 방문객이 함께 호흡하는 로컬형 문화 축제로 주목받고 있다. ‘BREAK FREE, CHILL, REPEAT’를 슬로건으로 내세운 이번 페스티벌은 서핑과 요가부터 음악과 불꽃놀이까지, 바다와 거리가 연결되는 축제 […]

더보이즈 주학년, 성매매 논란 끝 팀 퇴출…소속사 회장 "책임 통감, 전면 쇄신할 것"

보이 그룹 더보이즈의 멤버 주학년 이 성매매 논란에 휩싸이며 팀에서 전격 퇴출됐다. 이와 관련해 소속사 원헌드레드레이블(이하 원헌드레드)의 차가원 회장이 직접 고개를 숙였다. 팬들의 충격과 실망이 이어지는 가운데, 소속사는 내부 쇄신과 관리 체계 강화 방침을 밝혔다. 18일 차가원 회장은 공식 입장문을 통해 “최근 당사 소속 아티스트 및 구성원과 관련된 여러 상황으로 인해 팬 여러분과 대중께 심려를 […]