-
소프트웨어융합대학 한진영 교수, 인공지능 안전성·책임성 연구로 국무총리표창 수상
2026-04-24소프트웨어융합대학 한진영 교수, 인공지능 안전성·책임성 연구로 국무총리표창 수상 소프트웨어융합대학 한진영 교수가 4월 21일 개최된 ‘2026년 과학·정보통신의 날’ 기념식에서 국무총리표창을 수상했다. 과학기술정보통신부와 방송통신위원회가 공동 주최하는 ‘과학·정보통신의 날 정부포상’은 정보통신기술(ICT) 발전과 국가 혁신에 기여한 개인 및 단체를 대상으로 수여되는 정부 최고 수준의 권위 있는 포상으로, 연구 성과뿐 아니라 산업·정책적 파급효과와 국가 기여도를 종합적으로 평가한다는 점에서 의미가 크다. 한 교수는 인공지능 안전성과 책임성(Responsible AI) 분야를 선도하는 연구자로, 의료 등 고위험 환경에서 신뢰 가능한 인공지능 기술 구현을 위한 연구를 지속해왔다. 특히 멀티모달 데이터 기반의 인공지능 모델링과 인간 중심 설계를 결합하여, 실제 임상 및 사회 환경에서 발생할 수 있는 오류와 편향 문제를 체계적으로 분석하고 이를 완화하기 위한 방법론을 제시해왔다. 또한 국제 공동연구를 통해 인공지능의 사회적 영향과 윤리적 문제를 심층적으로 탐구하며, 기술 개발을 넘어 안전하고 책임 있는 인공지능 활용을 위한 학문적 기반을 확장해왔다. 이러한 연구는 의료, 정신건강, 사회적 의사결정 등 고위험 영역에서 인공지능의 신뢰성을 확보하기 위한 핵심 기술로 평가받고 있다. 한 교수는 연구 성과를 실제 사회적 활용으로 연결하는 데에도 주력해왔다. 공공 및 산업 분야와의 협력을 통해 인공지능 기술의 적용 가능성을 검증하고, 고위험 환경에서의 안전한 활용을 위한 방향성을 제시하는 등 학문적 성과를 국가 경쟁력 강화와 정보통신 생태계 발전으로 확장해왔다. 이번 국무총리표창은 인공지능 안전성 및 책임성 분야에서의 선도적 연구와 국제 협력, 그리고 고위험 영역에서 신뢰 가능한 인공지능 기술의 개발과 확산을 통해 국가 및 사회에 기여한 공로를 종합적으로 인정받은 결과이다. 한 교수는 “이번 수상은 함께 연구해온 동료 연구자들과 학생들, 그리고 학교의 지원 덕분이라 생각한다”며 “앞으로도 인공지능의 신뢰성과 사회적 책임을 고려한 연구를 통해 안전한 기술 발전에 기여하겠다”고 밝혔다.
DSSAL (지도교수: 김장현 교수) ACL 2026 main conference 논문 1편 게재 승인
2026-04-13DSSAL (지도교수: 김장현 교수) ACL 2026 main conference 논문 1편 게재 승인 제목: Jailbreaking Multimodal Large Language Models using Multi-Clip Video 저자: 강충원*, 선승종*, 전현민, 김장현 (*공동 제1저자) (좌측부터 강충원. 선승종. 전형민. 김장현 교수) 내용: 본 연구는 MLLM의 영상 입력 기반 jailbreak 취약성을 분석하기 위해 다양한 맥락의 다중 클립으로 구성된 MCV SafetyBench를 구축했습니다. 실험 결과, 클립 수와 맥락 다양성이 증가할수록 공격 성공률이 높아지는 현상이 나타났습니다. 또한, 영상 데이터는 이미지 데이터보다 더 취약한 경향을 보였으며, 이를 바탕으로 이미지 모달리티의 상대적 강건성을 활용한 방어 전략을 제안합니다.
AIM LAB(지도교수 : 홍성은 교수) , CVPR 2026 논문 1편 게재 승인
2026-03-23AIM LAB(지도교수 : 홍성은 교수) , CVPR 2026 논문 1편 게재 승인 인공지능 및 미디어 연구실(AI & Media Lab, AIM Lab)의 논문이 컴퓨터 비전 및 패턴 인식 분야 top-tier 학술대회인 CVPR 2026 (“The IEEE/CVF Conference on Computer Vision and Pattern Recognition 2026”)에 게재 승인되었습니다. 본 논문은 올해 6월 미국 덴버에서 발표될 예정입니다. 제목: ZOO-Prune: Training-Free Token Pruning via Zeroth-Order Gradient Estimation in Vision-Language Models 저자: 김영은*, Youjia Zhang*, Huiling Liu, 정애천, 이선우, 홍성은 (*공동 1저자) 본 논문은 Vision-Language Model(VLM)의 높은 계산 비용 문제를 해결하기 위해, 추가 학습 없이 토큰을 효율적으로 제거하는 training-free token pruning 문제를 다룹니다. 최근 VLM은 이미지와 텍스트를 동시에 처리하며 높은 성능을 보이지만, 입력 토큰 수가 많아질수록 연산량이 급격히 증가하는 한계가 있습니다. 기존 토큰 pruning 방식들은 attention score나 heuristic 기준에 의존하거나, 별도의 재학습이 필요하다는 문제가 있었습니다. ZOO-Prune은 이러한 한계를 극복하기 위해, zeroth-order gradient estimation 기반의 새로운 pruning 프레임워크를 제안합니다. 핵심 기여 - Zeroth-Order Token Importance Estimation: backpropagation 없이도 각 토큰이 모델 출력에 미치는 영향을 추정하기 위해, 입력 perturbation을 활용한 zeroth-order gradient estimation을 적용합니다. - Training-Free Plug-and-Play Pruning: 추가 학습이나 파인튜닝 없이 기존 VLM에 그대로 적용 가능하며, 다양한 구조의 모델에 일반적으로 적용 가능한 높은 범용성을 제공합니다. - Adaptive and Stable Token Selection: 단순 attention 기반 방법 대비 더 안정적으로 중요한 토큰을 선택하며, aggressive pruning 환경에서도 성능 저하를 최소화합니다. 그림. (a) Attention-based 방법은 attention score를 기반으로 토큰을 선택합니다. 이 과정에서 중요하지 않은 토큰이 포함되거나, 예측에 필요한 핵심 정보를 놓치는 문제가 발생할 수 있습니다. (b) Diversity-based 방법은 서로 다른 토큰을 선택하여 중복을 줄이고자 합니다. 그러나 선택된 토큰이 실제 모델 출력에 중요한 정보와 일치하지 않을 가능성이 있습니다. (c) 제안하는 ZOO-Prune은 zeroth-order gradient를 활용하여 각 토큰이 출력에 미치는 영향을 직접 추정합니다. 이를 바탕으로 정보성이 높고 중복이 적은 토큰을 선택하며, 노이즈에 강하고 안정적인 토큰 선택이 가능합니다.
dxlab (박은일 교수 연구실), CHI `26 (1), MMsys `26 (1), WWW `26 (2)에 총 4편 게재 승인
2026-03-16dxlab (박은일 교수 연구실), CHI `26 (1), MMsys `26 (1), WWW `26 (2)에 총 4편 게재 승인 dxlab (지도교수: 박은일, https://dsl.skku.edu)의 논문이 HCI 분야 최우수 학술대회인 CHI 2026에 1편, 인공지능/멀티미디어 분야 최우수 학술대회인 MMsys 2026에 1편, WWW 2026에 2편 게재 승인되었습니다. 해당 논문은 26년 4월에서 6월에 걸쳐, 바르셀로나와 홍콩, 두바이에서 발표될 예정입니다. 1) (CHI 2026) “Thriving, Not Just Growing: Structural Sustainability as the Key to Quality in Online Wellness Communities” 논문은 박신유 석사과정(인공지능융합학과), 차준엽 박사과정(인공지능융합학과), S. Shyam Sundar 교수가 저자로 참여하였고, 박은일 교수가 교신저자로 참여하였습니다. 이 논문은 온라인 웰니스 커뮤니티의 성공을 사용자 수나 활동량과 같은 양적 성장 지표로만 평가해 온 기존 접근의 한계를 지적합니다. 이를 보완하기 위해 연구팀은 커뮤니티의 장기적 품질을 결정하는 메커니즘으로 '구조적 지속가능성(Structural Sustainability)' 프레임워크를 제안했습니다. 해당 프레임워크는 지속적으로 참여하는 안정적인 핵심 사용자 구조(Stable User Structure), 단순한 정보 전달을 넘어선 질적으로 유의미한 상호작용(Meaningful Interaction), 조율된 커뮤니티 정체성(Coordinated Community Identity)이라는 세 축으로 구성됩니다. 연구팀은 2023-2024년 동안 56개의 Reddit 웰니스 커뮤니티에서 수집한 1,700만 건 이상의 게시글 데이터를 분석해 사용자(User), 콘텐츠(Content), 정체성(Identity) 차원에서 커뮤니티 품질을 정량적으로 측정했습니다. 분석 결과, 우수한 커뮤니티는 단순한 대화의 양이 아니라 충성도 높은 핵심 사용자와 상호 보완적인 깊은 대화에 의해 유지된다는 사실을 확인했습니다. 특히, 뚜렷한 커뮤니티 정체성은 내부 결속과 대화의 질을 높이는 핵심 요인으로 작용하는 동시에, 사용자 유입을 제한할 수 있는 성장-정체성 간 상충 관계 (Trade-off)를 형성하는 것으로 나타났습니다. 본 연구는 '성장=성공'이라는 기존 패러다임을 재고하고, 커뮤니티가 단순한 외형적 확장을 넘어 사용자들의 장기적인 웰빙과 신뢰를 구축하는 구조적 관점을 제시합니다. 이는 플랫폼 설계자와 운영자들이 단기적 활성 지표에 의존하기보다, 유의미한 상호작용과 안정적인 구조 유지에 초점을 맞춰야 함을 시사하며, 실질적인 커뮤니티 운영 가이드라인을 제공한다는 점에서 중요한 가치를 지닙니다. 2) (MMsys 2026) “MARs: Multi-Scale Convolution-Attention Residual Fusion for Video Summarization” 논문은 송준석 석박사통합과정(실감미디어공학과)이 제1저자로 참여하였으며, 이주엽 박사과정(인공지능융합학과)과 박은일 교수가 교신저자로 참여하였습니다. 이 논문은 비디오 요약에서 영상의 전체 흐름을 이해하는 능력과 프레임 간 세밀한 변화 포착을 동시에 수행하기 어렵다는 기존 모델의 한계를 해결하기 위해 MARs (Multi-scale Convolution-Attention Residual Fusion) 구조를 제안합니다. Multi-Head Self-Attention을 통해 영상 전체 프레임 간의 장기적인 관계와 스토리 흐름을 학습하고, Multi-Scale Convolution Module을 통해 인접 프레임 사이의 세밀한 변화와 동작 패턴을 함께 포착합니다. 실험 결과, 제안 방법은 SumMe와 TVSum 데이터셋에서 기존 방법보다 높은 성능을 기록하며, 추가적인 오디오나 텍스트 없이 영상 정보만으로도 우수한 요약 성능을 달성했습니다.이 연구는 전역 맥락과 지역적 변화 정보를 동시에 학습하는 구조를 통해 실제 영상 서비스 환경에서 활용 가능한 효율적인 비디오 요약 방법을 제시합니다. 3) (WWW 2026) “AIMER: Affective Intention-guided Multimodal Emotion Reasoner for Visual Emotion Analysis in Social Media” 논문은 이유빈 박사과정 (인공지능융합학과), 박신유 석사과정 (인공지능융합학과), 차준엽 박사과정 (인공지능융합학과), 박지원 석사과정 (실감미디어공학과)이 저자로 참여하였고, 박은일 교수가 교신저자로 참여하였습니다. 이 논문은 기존 Vision-Language Model(VLM) 기반 감정 인식이 이미지의 표면적인 시각 단서에 주로 의존하여 감정의 근본적인 의미나 의도를 충분히 반영하지 못하는 문제를 해결하기 위해 AIMER (Affective Intention-guided Multimodal Emotion Reasoner)를 제안합니다. 감정은 단순한 시각 표현이 아니라 인간의 동기와 의도에 의해 형성되는 인지적 과정이라는 관점에서, AIMER는 감정의 외적 표현과 내적 의도를 함께 고려하는 감정 이해 구조를 설계합니다. AIMER는 GPT-5.0을 활용하여 감정의 카테고리, 의도, 추론 정보를 포함한 Intention-aware Emotion Instruction을 생성하고, 이를 이미지에서 추출된 시각 특징과 결합하여 감정을 해석합니다. 생성된 감정 지시문과 시각 임베딩은 Q-Former를 통해 정렬되며, 이를 통해 모델이 단순한 감정 표현 인식을 넘어 감정의 의미와 맥락을 함께 이해하도록 합니다. 또한 Visual Projection과 LLM 사이에 Lightweight Emotion MLP를 추가하여 파라미터 효율적인 방식으로 감정 표현을 보정하고 추론 성능을 향상시킵니다. 이를 통해 AIMER는 다양한 감정 데이터셋에서 기존 vision 기반 및 multimodal 모델보다 우수한 성능을 보이며, 감정의 의도와 맥락을 함께 고려하는 감정 이해 모델로 활용될 수 있음을 보여줍니다. 4) (WWW 2026) “ReMi-ReMath: A Reverse-Mutual Reasoning Framework for Enhancing Mathematical Thinking in Small Language Models” 논문은 김대규 박사과정(인공지능융합학과), 문상규 박사과정(인공지능융합학과)이 참여하였으며, 박은일 교수가 교신저자로 참여하였습니다. 이 논문은 소형 언어 모델이 복잡한 수학적 추론 과정에서 논리적 일관성을 유지하지 못하고, 단순히 정답만 맞히는 현상을 해결하기 위해 ReMi-ReMath 프레임워크를 제안합니다. 기존의 상호 추론 방식이 정답의 일치 여부에만 집중했던 것과 달리, ReMi-ReMath는 추론 과정이 문제의 전제 조건을 충족하는지 검증하는 '논리적 타당성'에 초점을 맞추었습니다. 해당 모델은 Forward Generation - Reverse Reconstruction - Mutual Verification으로 구성되어, 먼저 모델이 문제에 대한 여러 추론 경로를 생성하면, 상호 추론 판별기가 해당 추론 과정과 도출된 정답을 바탕으로 역순으로 문제를 재구성합니다. 그 후, 재구성된 문제와 원래의 문제를 비교하여 수치적 일관성과 의미적 일관성을 측정하는 삼중 일관성을 계산하였습니다. 이를 통해 별도의 미세 조정없이 논리적으로 결함이 있는 추론 경로를 효과적으로 필터링합니다.실험 결과, ReMi-ReMath는 3.8B 규모의 소형 모델에서 기존 rStar 대비 3~5%p의 성능 향상을 기록하며 GSM8K, MATH 등 주요 벤치마크에서 우수한 정확도를 보였습니다. 특히 복잡한 논리가 필요한 고난도 문제에서 두드러진 성과를 거두어, SLM이 단순히 답을 맞히는 수준을 넘어 논리를 이해하고 검증하는 모델로 진화할 수 있는 가능성을 제시하였습니다.
발전기금


