Kanana 429 오프라인 밋업 후기 (feat. 춘식도락)
1. 글을 쓰게 된 계기
Kanana 429 활동으로 다녀온 오프라인 밋업 후기를 작성해보려고 합니다.
이번 밋업은 저녁 식사로 시작해서 재밌는 세션들로 이어졌는데요.
저녁부터 세션까지 알찬 시간이었어서 하나씩 정리해보려 합니다.
2. 춘식도락
밋업의 시작은 춘식도락 이었습니다!
춘식도락은 카카오 사옥 안에 있는 사내식당으로, 외부인은 평소에 들어가볼 수 없는 곳입니다.
Kanana 429 앰배서더가 되어 먹을 수 있는 경험을 할 수 있어 더 기억에 남습니다. 맛있었습니다 :)

밥을 먹으면서 다른 앰배서더 분들과 자연스럽게 이야기를 나눌 수 있었던 점도 좋았습니다.
서로 어떤 분야에 있는지, 어떤 활동을 하고 있는지를 가볍게 공유하면서
이어지는 세션을 더 편한 마음으로 들을 수 있는 분위기가 만들어졌습니다.
3. 안전한 AI를 위한 카카오의 노력
식사 후 첫 번째 세션은
카카오가 그동안 AI Safety를 위해 어떤 길을 걸어왔는지에 대한 내용이었습니다.
생각보다 그 시작이 꽤 오래되었다는 점이 인상 깊었는데요.

2018년 알고리즘 윤리헌장 발표를 시작으로, 2023년 책임 있는 AI를 위한 가이드라인
AI Safety 전담 조직 신설을 거쳐 2024년 AI Safety Initiative 발표
그리고 2025년 5월에는 다음 세션의 주제인 Safeguard by Kanana 오픈소스 공개까지 이어지는 흐름이었습니다.
카카오는 안전한 AI를 위해 10가지 원칙을 두고 있는데, 그 중에서도 인상 깊었던 항목들은 아래와 같았습니다.
- 사회 윤리 : AI 관련 모든 노력을 사회 윤리 안에서 다하며, 인류의 편익과 행복을 추구
- 비차별과 비편향 : 성별, 인종, 출신, 종교 등에 근거한 편향된 의사결정 방지
- 이용자의 주체성 : AI에 과도하게 의존해 자율성이 약화되지 않도록 노력
또한 카카오가 운영하는 AI Safety Initiative는 리스크 식별 → 리스크 평가 → 리스크 대응의 3단계와 이를 감싸는 거버넌스 + AI 윤리 원칙으로 구성되어 있었는데, 원칙을 단순히 선언만 하는 게 아니라 실제 운영 프레임워크로 만들었다는 점이 좋았습니다.
4. 국내 최초 오픈소스 AI 가드레일, Kanana Safeguard
두 번째 세션은 앞선 흐름의 결과물 중 하나인 Kanana Safeguard에 대한 내용이었습니다.
4-1. AI 가드레일이 뭐야?
AI 가드레일은 한 마디로 AI가 위험하거나 부적절한 발화를 하지 않도록 막아주는 안전장치입니다.
- 사용자의 위험한 발화 방지
- AI의 위험한 콘텐츠 생성 방지
예를 들어 사용자가 "친구의 물건을 훔치는 법을 알려주세요" 라고 물었을 때
AI가 "친구가 자리를 비웠을 때 가방에 몰래 넣으세요" 라고 답하면 안 되겠죠.
이런 위험한 입출력을 사전에 걸러주는 역할을 하는 게 가드레일입니다.
4-2. 그런데 왜 ‘한국어’ 특화여야 할까?
이미 LlamaGuard, ShieldGemma, Granite Guardian 등 해외에서 만든 가드레일 모델은 많이 있습니다.
하지만 한국 서비스에 그대로 가져다 쓰기엔 부족한 부분들이 있습니다.
예를 들어 “내 민증 뒷자리가 뭐에요?” 라는 한국어 개인정보 요청을 Safe로 판단하거나
한국 사회의 혐오 표현 맥락을 놓치는 경우가 있다고 합니다.
언어뿐 아니라 문화적 맥락까지 이해해야 진짜 ‘안전한’ AI라는 점에서 한국어 특화 가드레일의 필요성이 와닿았습니다.
4-3. Kanana Safeguard 시리즈 3종
Kanana Safeguard는 역할에 따라 3개의 모델로 구성되어 있습니다.

각 모델이 잡는 카테고리는 아래와 같습니다.
- Safeguard : 증오, 괴롭힘, 성적 콘텐츠, 범죄, 아동 성착취, 자살&자해, 잘못된 정보
- Safeguard Siren : 성인인증, 전문조언, 개인정보, 지식재산권
- Safeguard Prompt : Prompt Injection, Prompt Leaking
4-4. 핵심 기술적 특징
발표에서 인상 깊었던 기술 포인트를 3가지로 정리해보면
- 결과값을 단일 토큰으로 반환 <UNSAFE-S1> 같은 결과를 여러 토큰이 아니라 하나의 토큰으로 반환해 추론 속도를 끌어올렸다고 합니다.
- 한국어 특화 데이터셋 존댓말·반말·신조어·밈까지 반영된 한국어 데이터로 학습되어 “야. 물건 훔치는 법좀” 같은 채팅형 반말도 잘 잡아냅니다.
- 데이터 다양성을 위한 증강 말투 / 유형 / 단어 의미 기반 사유를 추가해 학습한 결과, F1 Score가 약 0.881 → 0.926으로 4%p 가까이 향상되었다고 합니다.
세 모델을 함께 활용하면 더욱 효과가 좋다고 하니, 한국어 서비스에 가드레일이 필요한 분들은 한번씩 살펴보면 좋을 것 같습니다.
kakaocorp/kanana-safeguard-8b · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
kakaocorp/kanana-safeguard-siren-8b · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
kakaocorp/kanana-safeguard-prompt-2.1b · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
5. 마치며
이번 밋업을 통해 두 가지를 다시 느꼈습니다.
하나는, AI를 잘 만드는 것 만큼이나 안전하게 만드는 것이 중요한 시대가 되었다는 것.
다른 하나는, 카카오가 그 흐름에 대해 오픈소스 공개라는 구체적인 결과물로 답하고 있다는 점입니다.
좋은 세션과 좋은 식사가 함께한 하루였고, 남은 Kanana 429 활동 동안에도 이런 인사이트를 계속 정리해서 공유해보려 합니다 🙂