-
인공지능융합학과/실감미디어공학과 학생 12명, AI 서울테크 대학원 장학생 선정
2025-11-10우리 학교 인공지능융합학과/실감미디어공학과 학생 12명이 AI 서울테크 대학원 장학생에 선정되었다. 선정된 장학생은 다음과 같다. 석사과정: 류보곤(지도교수 홍성은), 주세진, 양시현, 김지은, 박지안(지도교수 한진영), 최린, 전희정, 김기원, 박채원, 지현빈(지도교수 박은일) 박사과정: 최소윤(지도교수 홍성은), 김동재(지도교수 박은일) 서울장학재단은 위 학생들에게 각 500만원(석사과정)과 1천만원(박사과정)의 연구 장려금을 지원할 계획이다. 해당 장학금은 서울 소재의 AI 인재양성을 위해 서울특별시에서 신설한 사업으로 AI 기반의 전문 인재 양성을 위하여 조성되었다. *각 연구실 링크 홍성은 교수 - AIM LAB (https://aim.skku.edu/) 한진영 교수 - DSAIL (http://dsail.skku.edu/) 박은일 교수 - dxlab (https://dsl.skku.edu/)
인공지능융합학과 박은일 교수 연구팀, ICCV 2025 - ABAW VA Estimation Challenge 우승
2025-11-03▲(왼쪽부터) 성균관대 이유빈 박사과정생, 이상은 졸업생(現 ETRI 연구원), 박채원 석사과정생, 차준엽 박사과정생, 박은일 교수 우리 대학 인공지능융합학과 박은일 교수 연구팀이 세계 최고 권위의 인공지능(컴퓨터 비전) 학술대회인 ICCV 2025 (International Conference on Computer Vision)에서 개최된 ABAW (Affective Behavior Analysis in the Wild) / Valence-Arousal Estimation Challenge에서 1위를 차지했다고 밝혔다. 이번 대회는 2025년 10월 미국 하와이에서 열렸으며, 전 세계 유수 대학과 연구기관이 참가해 영상과 음성 등 비정형 멀티모달 데이터를 활용한 감정 상태 예측 기술을 경쟁했다. ▲ ICCV 2025 - ABAW Valence-Arousal Estimation Challenge에서 1위를 차지하며 수상한 인증서 ▲ ICCV 2025에서 1위 수상 연구를 발표하는 이유빈 박사과정(2025년 10월 20일, 미국 하와이 호놀룰루 컨벤션센터) ABAW 챌린지는 실제 환경에서 수집된 복잡한 멀티모달 데이터를 바탕으로 인간의 감정을 Valence-Arousal(긍정-부정, 활성화-비활성화) 축에서 정밀하게 추정하는 기술력을 평가한다. 특히 올해 대회는 시간적 변화에 대한 이해와 멀티모달 융합의 정교함을 요구해, 실시간 감정 추정 및 인간-인공지능 상호작용 분야의 핵심 벤치마크로 자리잡았다. 박은일 교수 연구팀은 Time-aware Gated Fusion(TAGF) 기반의 정서 인식 프레임워크를 제안해 우수한 성과를 거두었다. 제안된 모델은 BiLSTM 게이팅 메커니즘을 활용하여 시간에 따른 감정 변화를 동적으로 반영하고, 불필요한 잡음을 억제하면서 핵심 정서 단서를 강조함으로써 기존 모델 대비 높은 예측 성능을 달성했다. 이 결과는 실제 환경에서도 안정적이고 해석 가능한 감정 인식이 가능함을 보여주며, 향후 인간-AI 상호작용, 감정 기반 콘텐츠 분석, 정서 지능형 에이전트 개발 등 다양한 응용 분야로 확장될 수 있을 것으로 기대된다. ▲ 시각 및 음성 정보를 융합한 Time-aware Gated Fusion(TAGF) 기반 정서 예측 프레임워크 개략도 이번 성과는 박은일 교수 연구팀이 꾸준히 축적해 온 사용자 이해 기반의 범용 인공지능 기술 연구 역량을 다시 한번 세계적으로 인정받은 사례로 평가된다. 연구팀은 향후 감정 이해를 넘어, 인간의 인지적 맥락과 의도를 정밀하게 해석하는 차세대 정서 지능형 인공지능 기술 개발에 주력할 계획이다. 또한 이번 연구는 과학기술정보통신부와 정보통신기획평가원(IITP)이 지원하는 인간지향적 차세대 도전형 AI 기술 개발과 딥페이크 연구센터 사업의 일환으로 수행되었으며, ICCV 2025에서 공식 발표되었다. ※ 논문명: Dynamic Temporal Gating Networks for Cross-Modal Valence-Arousal Estimation ※ 저자명: 이유빈(제1저자), 이상은, 박채원, 차준엽(공동저자), 박은일(교신저자) ※ 학술대회: ICCV 2025 (International Conference on Computer Vision)
LAMDA (지도교수: 오하영 교수) WSDM 2025 논문 1편 게재 승인
2025-10-24LAMDA연구실(지도교수: 오하영)의 논문이 데이터 마이닝 분야의Top-tier 학술대회인 WSDM 2026 (The 19th ACM International Conference on Web Search and Data Mining) Main Conference에 게재 승인(Accept) 되었습니다. 왼쪽부터 LAMDA Lab 이진권, 김기성, 양혜지 ‘인공지능융합학과’ 학생(지도교수 : 오하영), ‘인터렉션사이언스학과’ 차동영 본 연구는 사회적으로 복잡하고 갈등을 유발하는 인터넷 밈을 정확히 해석하기 위해, 이미지·캡션·외부 문서를 통합하는 프레임워크 MerFT(Meme Exploration via Multimodal Retrieval-Augmented Fine-tuning)를 제안합니다. 함께 공개한 RoMQD데이터셋은KnowYourMeme 오라클 문서와 의미는 비슷하지만 맥락은 어긋나는‘디스트랙터’ 문서를 체계적으로 포함해, 현실적인 노이즈 환경에서의 해석 능력을 평가합니다. MerFT는 인용-인식Chain-of-Thought와 문서 정렬 기반 답변 손실을 결합하고, 오해를 부르는 외부 정보 의존을 명시적으로 패널티하여RAG의 취약점을 보완했습니다. 8개 사회갈등 영역, 6가지 인지 역량(문화 맥락, 풍자/아이러니, 이미지-텍스트 통합 등)에서 평가한 결과, Qwen2.5-VL 기준선 대비F1 +8.1을 달성했으며, 특히 풍자/아이러니와 이미지-텍스트 통합 과제에서 큰 개선을 보였습니다. 입력을 이미지+캡션+문서로 모두 활용할 때 가장 안정적이었고, 클러스터링 기반의 강한 디스트랙터 설계가 견고성을 한층 높였습니다. 또한 최신 재순위 기법과 결합한 하이브리드 접근이 계산 비용은 늘지만 최고 성능을 기록했습니다. 본 연구는 밈 기반 사회문화 갈등 분석을 위한 검색 강건성 다중모달 추론의 실현 가능성을 입증하고, 신뢰 가능한 콘텐츠 분석 시스템 구축에 실질적 지침을 제시합니다.
삼성학술정보관 3차원 공간데이터 국제표준화기구 MPEG의 공식 평가 영상으로 채택 달성
2025-10-14삼성학술정보관 3차원 공간데이터 국제표준화기구 MPEG의 공식 평가 영상으로 채택 달성 2025년 10월 11일, 성균관대학교 소프트웨어융합대학 인공지능융합학과 류은석 교수 연구실(MCSLab) 연구팀이 개발한 대규모 3D 영상 데이터셋 “Library”가 국제표준화기구 ISO/IEC JTC 1/SC 29/WG 4 (MPEG Video Coding)의 Gaussian Splat Coding(GSC) 필수 실험 평가용 공식 영상으로 채택되었다. 이번 성과는 한국전자통신연구원(ETRI)과 공동으로 추진된 국제 기고 결과로, 구래건, 김영규, 안승혁, 양이삭 연구원이 저자로 참여하였다. Library Sequence는 본교 내 삼성학술정보관과 주변 공간을 드론을 활용하여 실감형 3D로 기록한 대규모 데이터셋이다. 연구팀은 캠퍼스 공간을 실제와 동일한 비율로 항공 촬영하고, 이를 3차원 형태로 정밀 복원함으로써 현실 세계를 가상 공간으로 확장한 새로운 형태의 3D 디지털 자산을 구축하였다. 해당 데이터는 가우시안 스플래팅(Gaussian Splatting) 기술을 활용해 재구성되었으며, 이는 최근 전 세계에서 주목받고 있는 차세대 3D 실감 영상 기술이다. 국제표준화기구 MPEG은 현재 3D Gaussian Splatting 기반 영상 압축 기술(GSC)의 표준화를 추진 중이며, Library Sequence는 이 과정에서 성능 평가 검증을 위한 공식 실험 데이터(Exploration Experiment, JEE 6.1)로 지정되었다. 이는 향후 전 세계의 연구기관과 기업이 제안하는 모든 GSC 알고리즘이 Library Sequence를 기준으로 비교 및 검증된다는 것을 의미한다. 즉, 성균관대학교에서 제작한 데이터가 국제표준의 품질을 결정하는 ‘공통 시험 영상’으로 활용되는 사례로 평가된다. 또한 이번 성과는 한국전자통신연구원(ETRI) 와의 공동 연구를 통해 이루어졌으며, 국내 학계와 연구기관이 협력하여 국제표준의 중심에서 기술을 선도하고 있음을 보여준다. 이번 채택으로 인해 캠퍼스의 대표 공간이 전 세계 연구자들과 함께 실험하고 인용하는 국제 데이터 레퍼런스로 자리를 잡을 수 있게 되었다. 실감미디어 기술을 통해 본교의 공간이 글로벌 연구 무대에서 디지털 문화 자산으로 재탄생한 상징적인 사례가 되었고, 이에 연구팀은 국제표준화기구와 협력을 지속하며, Library Sequence를 기반으로 한 다양한 3차원 공간 데이터 압축 및 전송 실험과 기술 검증을 이어 나갈 예정이다. ※ 지도교수: 류은석 (성균관대학교 소프트웨어융합대학 인공지능융합학과) ※ 구래건, 김영규, 안승혁, 양이삭, 류은석 (성균관대학교) / 이하현, 방건 (ETRI) ※ 문의: esryu@skku.edu | http://mcsl.skku.edu/
발전기금


