-
- [학생실적] SW융합대학 실감미디어공학과, 2026 가상융합대학원 성과공유회’서 연구역량 입증 NEW
- SW융합대학 실감미디어공학과, 2026 가상융합대학원 성과공유회’서 연구역량 입증 W융합대학(학장 이은석 교수) 실감미디어공학과 2026 가상융합대학원 성과공유회’서 우수논문·산학협력·포스터 발표 부문 수상 통해 가상융합 분야 연구 경쟁력 입증 성균관대학교 실감미디어공학과 (류은석 학과장) 및 가상융합대학원 사업단 (사업단장 류은석교수)이 지난 6월 10일~12일 서울 코엑스에서 개최된 「2026 가상융합대학원 성과공유회(가상융합혁신인재 심포지엄)」에 참가해 우수 연구성과를 선보이고 다수의 수상 실적을 거두며 가상융합 분야 연구 경쟁력을 입증했다. 과학기술정보통신부와 정보통신기획평가원(IITP)이 주관한 이번 행사는 AX(AI 전환) 시대를 견인할 가상융합 석·박사 인재들의 성과를 격려하고, 기술 시연과 성과 공유를 통해 지속 가능한 성장 비전을 제시하기 위해 마련됐다. 행사에는 과학기술정보통신부, 정보통신기획평가원, 가상융합대학원 8개 대학 연구책임자, 협력기업, 수혜학생 등 150여 명이 참석했다. 행사는 ▲연구 몰입 환경 조성 및 성장 지원을 위한 소통 간담회 ▲공간컴퓨팅 등 대학원별 핵심요소기술 구현 성과를 소개하는 전시 ▲글로벌 학술성과 및 산학협력 프로젝트(PBL) 성과를 공유하는 발표 세션으로 구성됐다. 특히 ‘AX를 현실로(Realizing AI via XR)’를 주제로 가상융합 기술구현 역량과 인재 양성 성과를 대외적으로 선보이는 자리로 마련됐다. 성균관대학교는 행사장 내 대학 전시부스를 통해 다양한 연구성과를 소개했다. 양이삭 연구원은 「로봇 기반 4D Gaussian Splatting 영상 취득 및 촬영 자동화 기술」을 선보였으며, 구래건 연구원은 「Library: A Large-Scale Outdoor Gaussian Splat Reconstruction Dataset」을 주제로 우수논문 구두발표를 진행했다. 또한 김영규 연구원은 「3차원 공간컴퓨팅을 위한 Gaussian Splat Coding 연구 및 국제표준 개발」을 주제로 산학협력 프로젝트 성과를 발표하며 공간컴퓨팅 분야의 기술 개발 및 국제표준화 추진 성과를 공유했다. 양이삭 연구원의 「로봇 기반 4D Gaussian Splatting 영상 취득 및 촬영 자동화 기술」 체험 전시 구래건 연구원의 「Library: A Large-Scale Outdoor Gaussian Splat Reconstruction Dataset」 우수논문 구두발표 김영규 연구원의 「3차원 공간컴퓨팅을 위한 Gaussian Splat Coding 연구 및 국제표준 개발」 산학협력 프로젝트 발표 우수논문 포스터 발표 부문에서는 정애천 연구원과 이현민 연구원이 각각 AI 기반 시각-언어모델 추론 효율화 연구와 VR 환경에서의 팀워크 경험 분석 연구를 발표하며 가상융합 분야의 연구성과를 선보였다. 이현민 연구원의 「VR 팀워크 내 사회적 평가·작업부하 분석」 우수논문 포스터 발표 정애천 연구원의 「시각-언어모델 추론 가속을 위한 학습 없는 토큰 프루닝」 우수논문 포스터 발표 이번 성과공유회에서 성균관대학교 가상융합대학원 사업단은 우수논문, 산학협력 프로젝트, 포스터 발표 등 다양한 부문에서 수상자를 배출하며 뛰어난 연구 역량을 입증했다. 우수논문 발표회에서는 구래건 연구원이 최우수상을 수상했으며, 산학협력 프로젝트 발표회에서는 김영규 연구원이 우수상을 수상했다. 또한 우수논문 포스터 발표회에서는 정애천 연구원과 이현민 연구원이 각각 우수상을 수상하며 연구 우수성을 인정받았다. 성균관대학교 가상융합대학원 사업단은 공간컴퓨팅, XR, 인공지능 기반 3차원 콘텐츠 생성 기술 및 국제표준화 연구 등 미래 가상융합 산업을 선도할 핵심 기술 개발과 전문인력 양성에 주력하고 있다. 앞으로도 글로벌 수준의 연구성과 창출과 산학협력 확대를 통해 AX 시대를 이끌 가상융합 혁신 인재 양성에 지속적으로 힘쓸 계획이다. ※본 성과는 과학기술정보통신부와 정보통신기획평가원(IITP) 정보통신방송혁신인재양성사업 「가상융합대학원」과제 지원을 받아 수행된 연구결과입니다.
-
- 작성일 2026-06-12
- 조회수 218
-
- [연구] dxlab(지도교수 : 박은일), IJCAI 2026 1편, INTERSPEECH 2편 논문 게재 승인 NEW
- dxlab(지도교수 : 박은일), IJCAI 2026 1편, INTERSPEECH 2편 논문 게재 승인 Data eXperience Lab (dxlab, 지도교수: 박은일)의 논문이 인공지능과 음성처리 분야 top-tier 국제학술대회인 IJCAI 2026(1편)과 INTERSPEECH 2026(2편)에 게재 승인되었습니다. 제목: FedAMB: Adaptive Modality Balancing for Dominance-Robust Multimodal Federated Distillation 저자: 한승진, 이주엽, 이상민, 박은일 학술대회: International Joint Conference on Artificial Intelligence (IJCAI 2026, August 2026) 키워드: Multimodal Federated Learning, Federated Knowledge Distillation, Modality Dominance, Missing Modality Robustness Multimodal Federated Learning은 여러 modality를 분산 클라이언트 환경에서 프라이버시를 유지하며 학습할 수 있지만, modality별 학습 난이도 차이로 인해 특정 modality가 학습을 지배하는 modality dominance 문제가 발생합니다. 본 연구는 선택적 modality 학습과 knowledge distillation을 통해 multimodal accuracy와 unimodal robustness를 함께 향상시킵니다. 핵심 기여 ■ Contamination-Aware Modality Dominance 정의 Modality dominance를 Fed-KD의 global teacher contamination 문제로 재정의 ■ Selective-Modality Regulation (SMR) 제안 Dominance state를 감지하고, 필요한 경우 선택적으로 weak modality 학습을 강화 ■ Component-wise Modality Distillation (CMD) 제안 Global knowledge를 각 modality branch로 전달하여 unimodal robustness 향상 (a) FedAMB 프레임워크 그림 (a)는 FedAMB의 전체 프레임워크를 나타냅니다. 각 client는 먼저 modality dominance를 식별하고 SMR을 통해 local training을 조정한 뒤, proxy dataset에 대한 예측을 서버로 전달합니다. 서버는 이를 aggregation하여 global teacher를 구성하고, CMD를 통해 이 knowledge를 각 client의 modality branch에 distill함으로써 multimodal accuracy와 unimodal robustness를 함께 향상시킵니다. 제목: Temporal Transition-Aware Multi-Head Modeling for Partially Spoofed Audio Detection and Localization 저자: 김윤서, 이주엽, 박은일 학술대회: Interspeech 2026(September 2026) 키워드: Partially Spoofed Audio, Spoof Localization, Audio Boundary Detection 부분 조작 오디오 탐지(PSAL)는 하나의 발화 안에서 일부 구간만 가짜 오디오가 삽입된 경우, 이를 프레임 단위로 탐지하고 위치를 찾는 문제입니다. 기존 방법들은 주로 각 프레임의 진위 여부나 경계 예측에 집중했지만, 진짜 오디오와 가짜 오디오가 전환되는 순간의 시간적 변화를 충분히 활용하지 못했습니다. 본 논문은 인접 프레임 간의 시간적 변화를 핵심 단서로 활용하는 transition-aware localization framework를 제안하여, 가짜 오디오 구간의 시작과 종료를 더 정밀하게 탐지합니다. 핵심 기여 ■ Transition-aware PSAL 관점 제시 기존의 frame-wise authenticity prediction이나 boundary label 중심 접근을 넘어, 인접 프레임 간 temporal transition을 부분 조작 오디오 localization의 핵심 단서로 활용하는 새로운 관점을 제안 ■ Directional transition 기반 multi-head learning objective 제안 Real-to-Fake, Fake-to-Real과 같은 변화 방향을 명시적으로 학습하는 transition head와 frame-level score를 보정하는 refinement head를 결합하여, 조작 구간의 경계를 보다 정밀하게 탐지 ■ 세 가지 PSAL 데이터셋에서 성능 검증 PartialSpoof, PartialEdit-E1, PartialEdit-E2 데이터셋에서 실험을 수행하여, 제안 방법이 기존 기법 대비 우수한 frame-level localization 성능을 달성함을 확인 (a)Transition head와 refinement head 그림 (a) transition head는 각 프레임 쌍의 변화 양상을 분류하고, refinement head는 변화 정보와 프레임 독립적인 정보를 합쳐서 최종적으로 프레임을 분류합니다. (b) 하나의 발화에 대한 2D PCA trajectory 시각화 학습된 모델의 feature를 분석한 결과, 진짜 오디오와 가짜 오디오가 시간적으로 구분되는 표현을 가짐을 확인할 수 있습니다. 제목: K-DIALECT: Korean Dialect-Aware Face-Based Speech Synthesis 저자: 양성연, 이주엽, 박은일 학술대회: Interspeech 2026(September 2026) 키워드: Speech Synthesis, Multimodal Text-to-Speech, Korean Dialects Text-to-Speech는 주어진 텍스트를 읽는 발화 오디오를 생성하는 문제입니다. 기존 방법들은 정해진 음성으로만 텍스트를 읽거나 원하는 음성의 참고 오디오를 입력해야 했습니다. 하지만 원하는 대상에게 어울리는 음성을 자동으로 생성하는 연구는 부족했으며, 한국어 방언과 결합된 연구는 없었습니다. 본 논문은 원하는 대상의 이미지와 원하는 한국어 방언을 선택하면 대상에게 어울리는 음성으로 해당 방언으로 주어진 텍스트를 읽는 발화 오디오의 생성을 수행합니다. 핵심 기여 ■ 대상과 어울리는 음성으로 발화 오디오 생성 기존의 참고 오디오를 활용하는 발화 오디오 생성을 넘어, style encoder와 ID encoder를 통해 대상의 이미지에서 얼굴의 특징을 추출하여 대상에게 어울리는 음성으로 발화 오디오 생성 ■ 한국어 방언 발화 오디오 생성 서울, 강원, 경상, 전라, 제주, 충청 중 방언을 선택하면 T5 기반의 dialect translator와 pitch predictor를 통해 해당하는 방언으로 텍스트를 발화하는 오디오 생성 ■ 객관적·주관적 지표를 통한 성능 검증 참고 오디오를 활용한 기존 방법론과 비교실험을 수행한 결과 객관적 지표 뿐만 아니라, 한국인을 대상으로 평가한 주관적 지표에서도 더 우수한 성능 달성 (a) K-DIALECT 프레임워크 (b) Pitch Predictor (c)Image Encoder 그림 (a)는 텍스트와 대상의 이미지, 한국어 방언의 종류가 주어지면 대상에게 어울리는 음성으로 텍스트를 발화하는 오디오를 생성합니다. 그림 (b)는 방언의 종류에 따라 음성을 조정하고, 그림 (c)는 이미지에서 대상의 얼굴 특징을 추출합니다.
-
- 작성일 2026-06-10
- 조회수 137
-
- [학생실적] 인공지능융합학과/실감미디어공학과 학생 13명, 2026년 AI 서울테크 대학원 장학생 선정 NEW
- 인공지능융합학과/실감미디어공학과 학생 13명, 2026년 AI 서울테크 대학원 장학생 선정 우리 학교 인공지능융합학과/실감미디어공학과 학생 13명이 AI 서울테크 대학원 장학생에 선정되었다. 선정된 장학생은 다음과 같다. 박사/석박통합과정: 류보곤, 김홍엽(지도교수 홍성은), 원현선(지도교수 한진영), 이유빈(지도교수 박은일) 석사과정: 김종한, 박지안, 양시현, 김지은, 이유진, 김지현(지도교수 한진영), 한승진, 박채원, 박신유(지도교수 박은일) 서울장학재단은 위 학생들에게 각 4천만원(박사과정)과 2천만원(석사과정)의 연구 장려금을 지원할 계획이다. 해당 장학금은 서울 소재의 AI 인재양성을 위해 서울특별시에서 신설한 사업으로 AI 기반의 전문 인재 양성을 위하여 조성되었다. *각 연구실 링크 박은일 교수 - dxlab (https://dsl.skku.edu/) 한진영 교수 - DSAIL (http://dsail.skku.edu/) 홍성은 교수 - AIM LAB (https://aim.skku.edu/)
-
- 작성일 2026-06-08
- 조회수 230
-
- [연구] AIM LAB(지도교수 : 홍성은 교수) , ICML 2026 논문 게재 승인
- AIM LAB(지도교수 : 홍성은 교수) , ICML 2026 논문 게재 승인 인공지능 및 미디어 연구실(AI & Media Lab, AIM Lab, 지도교수: 홍성은 교수)의 논문이 머신러닝 분야 top-tier 국제학술대회인 ICML 2026 (International Conference on Machine Learning)에 게재 승인되었습니다. 제목: SyMerge: From Non-Interference to Synergistic Merging via Single-Layer Adaptation 저자: 정애천, 이승환, 한동윤, 홍성은 학술대회: International Conference on Machine Learning (ICML 2026), July 2026 키워드: Model Merging, Multi-task Learning, Test Time Adaptation Model merging은 각 태스크별로 독립적으로 학습된 모델을 파라미터 수준에서 결합함으로써, 대규모 multi-task learning에 필요한 높은 학습 비용을 줄일 수 있는 효율적인 접근법입니다. 기존 방법들은 model merging 적용 시 태스크 간 성능 저하를 막는 non-interference에 초점을 맞추어 왔지만, 본 논문은 태스크 간 간섭을 줄이는 것에서 나아가, 서로 다른 태스크 간의 시너지 효과를 유도하는 방향으로 model merging을 수행합니다. 핵심 기여 ■ Synergistic model merging 관점 제시 태스크 간 간섭을 줄이는 것을 넘어, 서로 다른 태스크가 상호 보완적으로 성능을 향상시킬 수 있는 model merging 방향을 제안 ■ Single-layer adaptation 기반 경량화 방법 제안 전체 모델을 재학습하지 않고, 단 하나의 task-specific layer와 merging coefficient만을 적응시켜 효율적으로 merged model의 성능을 향상시킴 ■ 다양한 태스크에서의 효과 검증 Vision, dense prediction, NLP benchmark에서 제안 방법의 효과를 검증하고, 적응된 layer가 다른 merging 방법에도 활용될 수 있음을 확인 그림 (a) 여러 task-specific 모델을 하나의 merged encoder로 결합한 뒤, classifier를 재학습하여 태스크 간 representation 정렬을 강화합니다. 이후 cross-task encoder 평가를 통해 서로 다른 태스크 간 호환성을 측정합니다. 그림 (b) 단 하나의 layer와 merging coefficient를 함께 적응시키는 방식이 가장 높은 성능을 보여, SyMerge의 경량성과 효과성을 확인할 수 있습니다.
-
- 작성일 2026-05-11
- 조회수 786
-
- [교수동정] 소프트웨어융합대학 한진영 교수, 인공지능 안전성·책임성 연구로 국무총리표창 수상
- 소프트웨어융합대학 한진영 교수, 인공지능 안전성·책임성 연구로 국무총리표창 수상 소프트웨어융합대학 한진영 교수가 4월 21일 개최된 ‘2026년 과학·정보통신의 날’ 기념식에서 국무총리표창을 수상했다. 과학기술정보통신부와 방송통신위원회가 공동 주최하는 ‘과학·정보통신의 날 정부포상’은 정보통신기술(ICT) 발전과 국가 혁신에 기여한 개인 및 단체를 대상으로 수여되는 정부 최고 수준의 권위 있는 포상으로, 연구 성과뿐 아니라 산업·정책적 파급효과와 국가 기여도를 종합적으로 평가한다는 점에서 의미가 크다. 한 교수는 인공지능 안전성과 책임성(Responsible AI) 분야를 선도하는 연구자로, 의료 등 고위험 환경에서 신뢰 가능한 인공지능 기술 구현을 위한 연구를 지속해왔다. 특히 멀티모달 데이터 기반의 인공지능 모델링과 인간 중심 설계를 결합하여, 실제 임상 및 사회 환경에서 발생할 수 있는 오류와 편향 문제를 체계적으로 분석하고 이를 완화하기 위한 방법론을 제시해왔다. 또한 국제 공동연구를 통해 인공지능의 사회적 영향과 윤리적 문제를 심층적으로 탐구하며, 기술 개발을 넘어 안전하고 책임 있는 인공지능 활용을 위한 학문적 기반을 확장해왔다. 이러한 연구는 의료, 정신건강, 사회적 의사결정 등 고위험 영역에서 인공지능의 신뢰성을 확보하기 위한 핵심 기술로 평가받고 있다. 한 교수는 연구 성과를 실제 사회적 활용으로 연결하는 데에도 주력해왔다. 공공 및 산업 분야와의 협력을 통해 인공지능 기술의 적용 가능성을 검증하고, 고위험 환경에서의 안전한 활용을 위한 방향성을 제시하는 등 학문적 성과를 국가 경쟁력 강화와 정보통신 생태계 발전으로 확장해왔다. 이번 국무총리표창은 인공지능 안전성 및 책임성 분야에서의 선도적 연구와 국제 협력, 그리고 고위험 영역에서 신뢰 가능한 인공지능 기술의 개발과 확산을 통해 국가 및 사회에 기여한 공로를 종합적으로 인정받은 결과이다. 한 교수는 “이번 수상은 함께 연구해온 동료 연구자들과 학생들, 그리고 학교의 지원 덕분이라 생각한다”며 “앞으로도 인공지능의 신뢰성과 사회적 책임을 고려한 연구를 통해 안전한 기술 발전에 기여하겠다”고 밝혔다.
-
- 작성일 2026-04-24
- 조회수 542
-
- [연구] IMCLab (류은석 교수 연구실) , IEEE VR 2026 및 IIMC 2026 통해 국제 학술 성과 창출
- IMCLab (류은석 교수 연구실) , IEEE VR 2026 및 IIMC 2026 통해 국제 학술 성과 창출 SW융합대학(학장 이은석 교수) 실감미디어공학과는 2026년 3월21일~3월 25일 대구에서 개최된 IEEE VR 2026에 참여하며, 몰입형 미디어 분야에서의 연구 성과를 국제 학술무대에 선보였다. IEEE VR은 가상현실(VR), 증강현실(AR), 혼합현실(XR) 및 3D 사용자 인터페이스 분야에서 세계적으로 권위 있는 학회로, 관련 분야의 최신 연구와 기술이 집약되는 대표적인 국제 행사이다. 이번 학회와 함께 개최된 IIMC 2026(International Workshop on Intelligent Immersive Media Communications)는 SW융합대학 실감미디어공학과 학과장인 류은석 교수가 조직을 맡아 운영한 워크샵으로, 학과 연구진이 중심이 되어 주도적으로 참여하였다. 본 워크샵은 3D 몰입형 미디어 기술과 신경망 기반 시각 표현, 데이터 압축 등 핵심 연구 주제를 중심으로 구성되었으며, 특히 Gaussian Splatting 및 MPEG Gaussian Splat Coding(GSC)과 같은 최신 기술과 표준화 동향을 다루며 이론과 실제 구현을 아우르는 실용 중심 학술 교류의 장으로 자리매김하였다. 이러한 성과는 지능형멀티미디어연구센터의 체계적인 연구 지원을 기반으로 이루어졌다는 점에서 의미가 크다. 센터의 지원 아래 실감미디어공학과는 국제 워크샵 주관과 연구 발표를 성공적으로 수행하며, 글로벌 연구 협력 네트워크 속에서 학문적 위상을 더욱 공고히 하였다. 워크샵에서는 해외 주요 연구기관과 국내 연구진이 참여하여 3D Gaussian Splatting의 응용 및 압축 기술, MPEG 기반 표준화 동향, 확장 가능한 3D 표현 기법 등에 대한 심도 있는 논의가 이루어졌다. 이를 통해 실감미디어공학과는 최신 기술 흐름을 선도적으로 공유하고, 국제 공동연구로 이어질 수 있는 협력 기반을 강화하는 성과를 거두었다. ▲ IIMC 2026 KEYNOTE SPEAKER [좌측부터 Prof. Yiyi Liao(Zhejiang University), 방건 박사(한국전자통신연구원), 박은병 교수(연세대학교)] 또한 발표 세션에서는 총 8편의 연구가 소개되었으며, 이 중 실감미디어공학과 구성원들이 참여한 연구들이 포함되어 학과 차원의 연구 경쟁력을 확인할 수 있었다. 해당 연구들은 모바일 환경에서의 3D Gaussian Splatting 활용, 대규모 야외 데이터셋 구축, 압축 및 표준 포맷 연계 기술 등 다양한 측면에서 몰입형 미디어 기술의 확장 가능성을 제시하였으며, 일부 연구는 우수 논문으로 선정되는 성과를 거두었다. ▲ IIMC 2026 구두 발표자[좌측부터 이순빈 연구원(Fraunhofer HHI), 구래건 석사과정, 양이삭 석박통합과정(실감미디어공학과)] 이번 IEEE VR 2026 및 IIMC 2026 참여는 실감미디어공학과가 지능형멀티미디어연구센터의 지원을 바탕으로 연구 역량을 체계적으로 축적하고, 이를 국제 학술무대에서 가시적인 성과로 확장해 나가고 있음을 보여준다. 앞으로도 양 기관은 긴밀한 협력을 통해 몰입형 미디어 및 차세대 3D 콘텐츠 기술 분야에서 지속적인 연구 성과 창출과 글로벌 경쟁력 강화를 이어갈 것으로 기대된다.
-
- 작성일 2026-03-27
- 조회수 765
-
- [연구] AIM LAB(지도교수 : 홍성은 교수) , CVPR 2026 논문 1편 게재 승인
- AIM LAB(지도교수 : 홍성은 교수) , CVPR 2026 논문 1편 게재 승인 인공지능 및 미디어 연구실(AI & Media Lab, AIM Lab)의 논문이 컴퓨터 비전 및 패턴 인식 분야 top-tier 학술대회인 CVPR 2026 (“The IEEE/CVF Conference on Computer Vision and Pattern Recognition 2026”)에 게재 승인되었습니다. 본 논문은 올해 6월 미국 덴버에서 발표될 예정입니다. 제목: ZOO-Prune: Training-Free Token Pruning via Zeroth-Order Gradient Estimation in Vision-Language Models 저자: 김영은*, Youjia Zhang*, Huiling Liu, 정애천, 이선우, 홍성은 (*공동 1저자) 본 논문은 Vision-Language Model(VLM)의 높은 계산 비용 문제를 해결하기 위해, 추가 학습 없이 토큰을 효율적으로 제거하는 training-free token pruning 문제를 다룹니다. 최근 VLM은 이미지와 텍스트를 동시에 처리하며 높은 성능을 보이지만, 입력 토큰 수가 많아질수록 연산량이 급격히 증가하는 한계가 있습니다. 기존 토큰 pruning 방식들은 attention score나 heuristic 기준에 의존하거나, 별도의 재학습이 필요하다는 문제가 있었습니다. ZOO-Prune은 이러한 한계를 극복하기 위해, zeroth-order gradient estimation 기반의 새로운 pruning 프레임워크를 제안합니다. 핵심 기여 - Zeroth-Order Token Importance Estimation: backpropagation 없이도 각 토큰이 모델 출력에 미치는 영향을 추정하기 위해, 입력 perturbation을 활용한 zeroth-order gradient estimation을 적용합니다. - Training-Free Plug-and-Play Pruning: 추가 학습이나 파인튜닝 없이 기존 VLM에 그대로 적용 가능하며, 다양한 구조의 모델에 일반적으로 적용 가능한 높은 범용성을 제공합니다. - Adaptive and Stable Token Selection: 단순 attention 기반 방법 대비 더 안정적으로 중요한 토큰을 선택하며, aggressive pruning 환경에서도 성능 저하를 최소화합니다. 그림. (a) Attention-based 방법은 attention score를 기반으로 토큰을 선택합니다. 이 과정에서 중요하지 않은 토큰이 포함되거나, 예측에 필요한 핵심 정보를 놓치는 문제가 발생할 수 있습니다. (b) Diversity-based 방법은 서로 다른 토큰을 선택하여 중복을 줄이고자 합니다. 그러나 선택된 토큰이 실제 모델 출력에 중요한 정보와 일치하지 않을 가능성이 있습니다. (c) 제안하는 ZOO-Prune은 zeroth-order gradient를 활용하여 각 토큰이 출력에 미치는 영향을 직접 추정합니다. 이를 바탕으로 정보성이 높고 중복이 적은 토큰을 선택하며, 노이즈에 강하고 안정적인 토큰 선택이 가능합니다.
-
- 작성일 2026-03-23
- 조회수 1088
-
- [연구] main Lab(지도교수: 김재광) The 2026 ACM Web Conference (WWW) Research Track 게재 승인
- main Lab. 연구실 (지도교수: 김재광) 논문이 Top-tier 국제학술대회 The 2026 ACM Web Conference (WWW) Research Track에 게재 승인되었습니다. 논문은 26년 4월 두바이에서 발표될 예정입니다. "FCRLLM: Aligning LLM with Collaborative Filtering for Long-tailed Sequential Recommendation" 논문은 허병문 (인공지능융합학과 박사과정), 이남준 (인공지능융합학과 석사과정), 김선아 (소프트웨어학과 석사과정) 이 저자로 참여하였고 김재광 교수가 교신저자로 참여하였습니다. 이 연구는 상호작용 데이터가 부족한 Long-tailed 사용자 및 아이템에서의 추천 문제를 해결하기 위해, 거대언어모델(LLM)의 풍부한 의미론적(Semantic) 지식과 기존의 협업 필터링 신호를 결합한 FCRLLM 프레임워크를 제안합니다. 핵심 기술인 '플립드 클래스룸(Flipped Classroom)' 메커니즘은 협업 표현과 의미론적(Semantic) 표현이 서로 스승과 제자의 역할을 교차 수행하며 동적으로 정렬(aligned) 되도록 유도합니다. 이 과정에서 홉필드 네트워크 기반의 에너지 함수를 활용하여 두 양식 간의 어텐션 패턴 차이를 최소화하고 상호 보완적인 학습을 가능하게 합니다. 제안 방법은 세 개의 실제 데이터셋을 활용하여 실험하였고, 그 결과 제안 방법이 아이템의 인기나 사용자의 활동 수치와 관계없이 추천 성능을 일관되게 향상시키는 것으로 나타났습니다. 본 연구는 서로 다른 차원의 정보들을 양방향 교사-학생 구조로 통합함으로써 더욱 정교하고 다양한 추천 시스템을 구축할 수 있음을 보여줍니다.
-
- 작성일 2026-01-15
- 조회수 1020
-
- [일반] SW융합대학 실감미디어공학과 Annual Research Review 성료
- SW융합대학 실감미디어공학과 Annual Research Review 성료 SW융합대학 실감미디어공학과(학과장: 류은석 교수)는 지난 11월 27일(목) 오후 4시 30분, 인문사회과학캠퍼스 국제관 5층 Global R&E Lounge에서 2025 Annual Research Review 행사를 성공적으로 개최했다. 이번 행사에는 실감미디어공학과, 인공지능융합학과, 인터랙션사이언스학과, 인공지능융합전공 등 4개 학과가 공동 참여하여 XR/VR & Immersive Experiences, 3D Gaussian Splatting & Graphics Systems, Multimodal Understanding & Generation, Human-AI Interaction & Social Computing, AI for Emotion & Mental Health, Data-Driven Modeling & Recommendation의 총 6개 분야에서 41팀의 연구 발표가 진행되었으며, 실감미디어 연구의 현재와 미래를 조망하는 의미 있는 자리로 꾸려졌다. 발표는 포스터 전시 및 데모 시연 형식으로 진행되었고, 연구의 실질적 적용 가능성과 기술적 확장성에 대한 활발한 논의가 이어졌다. 행사에 앞서 개최된 Industrial Advisory Board(IAB, 기업자문위원) 사전 미팅에는 LG전자, 삼성전자, 상화, 올림플래닛, SOS Lab, ETRI(한국전자통신연구원), LG U+, LG 헬로비전, 정보통신기획평가원(IITP) 등 주요 ICT 및 콘텐츠 분야 기업과 연구기관 관계자들이 참석했다. 참석 전문가들은 XR 디바이스, 로봇 기반 비전 기술, LiDAR 센서 및 volumetric 영상 기술, AI 기반 실감미디어 서비스, 미래 네트워크 및 Web3 기술 등 산업이 요구하는 핵심 기술 동향과 산학연 협력 방향에 대해 심도 있는 의견을 나누며, 산학 공동 연구 생태계 구축의 중요성을 강조했다. 연구 성과 관람 및 전문가 평가 이후 진행된 ‘Outstanding Research Award’ 시상식에서는 학부와 대학원 부문으로 나누어 수상자가 선정되었다.학부 부문에서는 인공지능융합전공 강민구 학우가 최우수 연구상을 수상했으며, 김수현 학우와 오경준 학우가 우수 연구상을 받았다. 대학원 부문에서는 인공지능융합학과 이유빈 연구원이 최우수 연구상을 수상했다. 우수 연구상은 △실감미디어공학과 김종한 연구원 △메타바이오헬스학과 오민우 연구원과 인공지능융합학과 박민수 연구원(팀) △실감미디어공학과 주민준 연구원 △실감미디어공학과 정의준 연구원에게 돌아갔다. 이번 시상은 창의적인 연구 역량과 실질적인 기술 발전 가능성을 보여준 연구자들의 노력을 인정하는 자리였다. 더불어 본 행사에는 특별히 류덕희 총동창회 고문(경동제약 명예회장)이 참석하여, 미래 기술을 선도할 연구자로 성장하는 학생들에게 실질적인 조언과 진심 어린 격려의 메시지를 전했다. 현장의 학생들과 연구진은 산업 현장에서 요구되는 실천적 역량과 연구 태도에 대한 인사이트를 얻으며 소중한 시간을 가졌다. 행사를 기획한 실감미디어공학과 류은석 학과장은 “Annual Research Review는 연구자들이 서로의 성과를 공유하고 새로운 협력 기회를 발굴하는 중요한 자리이며, 앞으로도 실감미디어 분야를 선도하는 글로벌 연구 허브로 성장해 나가겠다”고 밝혔다. 실감미디어공학과는 과학기술정보통신부 가상융합대학원 사업의 지원을 기반으로 우수 대학원생 선발과 해외 파견 연구 프로그램을 운영하며, 영상처리, 그래픽스, 인공지능 분야 미래 인재 양성을 위한 연구 환경과 국제 협력 체계를 지속적으로 확장하고 있다. 이번 Annual Research Review는 학부와 대학원 연구자들의 성과 공유뿐만 아니라 산업계와의 협력을 강화하고 미래 성장 기반을 마련한 뜻깊은 행사로 마무리되었다.
-
- 작성일 2025-12-02
- 조회수 1513
-
- [연구] AIM Lab(지도교수: 홍성은 교수) NeurIPS 2025 논문 2편 발표
- 인공지능 및 미디어 연구실(AI & Media, AIM LAB)의 논문 2편이 미국 San Diego에서 개최되는 AI 분야 세계 최고 권위의 학술대회인 NeurIPS (Conference on Neural Information Processing Systems) 2025에서 발표 예정입니다. 논문1. Backpropagation-Free Test-Time Adaptation via Probabilistic Gaussian Alignment (Youjia Zhang, 김영은, 최영근, 김홍엽, Huiling Liu, 홍성은) 본 논문은 이미지 분류 모델이 배경·스타일·조명·노이즈 등 다양한 분포 변화 상황에서 성능이 떨어지는 문제를 해결하기 위해, 테스트 시점에서 모델을 빠르게 적응시키는 Test-Time Adaptation(TTA) 과제를 다룹니다. 기존 TTA는 반복 최적화나 backpropagation에 의존해 실시간 적용이 어려웠습니다. ADAPT는 이 문제를 해결하기 위해 가우시안 분포 정렬 기반의 완전 backprop-free 적응 방식을 제안하며, 효율성과 안정성을 동시에 확보했습니다. - Gaussian Distribution Modeling: 클래스별 특징 분포를 가우시안으로 단순·명확하게 모델링해, 반복 계산 없이 바로 적응할 수 있도록 합니다. - Lightweight Regularization with CLIP Priors: 신뢰도 높은 특징을 축적하는 knowledge bank와 CLIP 기반 priors를 활용해, 예측의 일관성과 안정성을 유지합니다. ADAPT는 단순하고 가벼운 구조를 기반으로 backpropagation 없이도 강력한 TTA 적응 성능을 보여주며, 다양한 분포 변화 환경에서 기존 최신 기법들을 능가하는 성능을 입증했습니다. 논문2. PRIMT: Preference-based Reinforcement Learning with Multimodal Feedback and Trajectory Synthesis from Foundation Models 본 논문은 로봇의 움직임·조작·보행 등 다양한 행동 궤적을 비교해 어떤 궤적이 더 선호되는지 학습하는 PbRL(Preference-based Reinforcement Learning) 문제를 다룹니다. 기존 방식들은 단일 모달리티에 의존해 선호 판단이 불안정하거나, 초기 학습 단계에서 쿼리가 모호해지는 문제가 있었습니다. PRIMT는 이러한 한계를 극복하기 위한 새로운 프레임워크로, LLM과 VLM을 결합한 멀티모달 선호 융합과 궤적 생성(foresight/hindsight) 방식을 통해 더 정확하고 안정적인 선호 학습을 가능하게 합니다. - Hierarchical Multimodal Preference Fusion: LLM과 VLM이 제공하는 상보적 정보를 결합해, 로봇 행동의 선호를 더 정확하고 안정적으로 판단합니다. - Bidirectional Trajectory Synthesis: LLM이 다양한 초기 궤적을 생성해 학습 초반의 모호한 비교 문제를 줄이고, 반사실(counterfactual) 궤적을 만들어 보상 신호가 어떤 행동에 의해 결정되는지 명확히 드러냅니다. PRIMT는 기존 PbRL의 약점을 보완하면서, 조건 충실도와 행동 자연스러움 모두를 개선하는 결과를 보여주었고 다양한 로봇 조작 및 이동 과제에서 성능 향상을 입증했습니다.
-
- 작성일 2025-12-01
- 조회수 1094
발전기금






