
카카오(대표 정신아)는 인공지능(AI) 서비스의 안전성과 신뢰성을 검증할 수 있는 AI 가드레일 모델 ‘Kanana Safeguard(카나나 세이프가드)’를 개발, 국내 기업 최초로 총 3종의 모델을 오픈소스로 공개한다고 27일 밝혔다.
최근 다양한 생성형 AI 서비스들이 확산하는 가운데 유해 콘텐츠의 위험성에 대한 사회적 우려가 커지고 있다. 주요 빅테크는 생성형 AI를 통해 발생할 수 있는 위험 요소를 감지하는데 특화된 모델을 운영 중이다.
‘Kanana Safeguard’는 카카오가 자체 개발한 언어모델 ‘Kanana’를 기반 기술로 활용했다. 한국어 및 한국 문화를 반영한 자체 구축 데이터셋을 활용해 한국어에 특화된 성능을 보유하고 있다는 게 카카오의 설명이다.
AI 모델의 정밀도와 재현율을 평가하는 수치인 F1 스코어(F1-Score)를 기준으로 평가한 결과, 한국어 성능에서 글로벌 모델 이상의 성과를 기록하기도 했다.
카카오는 "이번에 오픈소스로 공개한 모델은 총 3가지로, 각각의 모델은 리스크 유형에 따라 유해성 및 위험성에 대한 효과적 탐지가 가능하다"고 덧붙였다.