[연구] DSSAL (지도교수: 김장현 교수) ACL 2026 main conference 논문 1편 게재 승인
- 인공지능융합학과(일반대학원)
- 조회수535
- 2026-04-13
DSSAL (지도교수: 김장현 교수) ACL 2026 main conference 논문 1편 게재 승인
제목: Jailbreaking Multimodal Large Language Models using Multi-Clip Video
저자: 강충원*, 선승종*, 전현민, 김장현 (*공동 제1저자)

(좌측부터 강충원. 선승종. 전형민. 김장현 교수)

내용: 본 연구는 MLLM의 영상 입력 기반 jailbreak 취약성을 분석하기 위해 다양한 맥락의 다중 클립으로 구성된 MCV SafetyBench를 구축했습니다. 실험 결과, 클립 수와 맥락 다양성이 증가할수록 공격 성공률이 높아지는 현상이 나타났습니다. 또한, 영상 데이터는 이미지 데이터보다 더 취약한 경향을 보였으며, 이를 바탕으로 이미지 모달리티의 상대적 강건성을 활용한 방어 전략을 제안합니다.
발전기금


