-
- [연구] 박호건 교수 연구실 (LearnData Lab)의 그래프 신경망 연구 WSDM 2025 논문 게재 승인 (석사졸업: 박종원, 박사과정: 정희수) NEW
- 박호건 교수 연구실 (LearnData Lab)의 그래프 신경망 연구 WSDM 2025 논문 게재 승인 (석사졸업: 박종원, 박사과정: 정희수) LearnData연구실 (지도교수: 박호건)의 논문이 인공지능 분야 최우수학회인 The 18th ACM International Conference on Web Search and Data Mining에 게재 승인(Accept) 되었습니다. 1. 논문 “CIMAGE: Exploiting the Conditional Independence in Masked Graph Auto-encoders” 은 인공지능학과 박종원 (석사졸업생)이 제1저자로 게재하였으며, 소프트웨어학과 정희수 (박사과정)이 공동 1저자로 참여했습니다. 성균관대학교의 박호건 교수 연구진은 자기 지도 학습(Self-Supervised Learning)을 기반으로 하는 그래프 신경망(GNN) 학습 기술 연구에서 높은 수준의 성과를 달성했습니다. 이번 연구는 CIMAGE (Conditional Independence Aware Masked Graph Auto-Encoder) 라는 모델을 개발하여, 기존의 무작위 마스킹 방식이 가진 한계를 극복하고 그래프 신경망의 표현력을 한층 더 강화하였습니다. CIMAGE 모델은 조건부 독립성(Conditional Independence)을 활용해 마스킹 전략을 설계하며, 이를 통해 그래프 표현 학습의 효율성과 정확도를 크게 높였습니다. 특히, 이번 연구에서는 높은 신뢰도의 가짜 레이블을 사용하여 두 가지 독립된 맥락을 생성하고, 이를 통해 마스킹과 재구성 작업을 수행하는 새로운 사전 학습(pretext task) 방법을 제안하였습니다. CIMAGE의 성능은 다양한 그래프 벤치마크 데이터셋에서 우수함을 입증했으며, 노드 분류 및 링크 예측과 같은 다운스트림 작업에서 높은 정확도를 기록하며, 그래프 표현 학습 분야의 새로운 기준을 제시하고 있습니다. 이 연구는 성균관대학교의 혁신적이고 선도적인 연구 방향을 보여주는 중요한 성과로, 그래프 신경망 연구 및 자율 학습 분야에서 널리 활용될 가능성이 높습니다. LearnData 연구실은 그래프, 자연어, 센서, 이미지 등 다양한 모달리티를 활용한 기계학습 및 데이터마이닝 기술 개발, 설명 가능 AI 기술 연구 등을 수행하고 있습니다. 이번 WDSM 2025 논문의 연구는 인공지능대학원, 정보통신기획평가원, 한국콘텐츠진흥원 등의 지원으로 진행되었습니다. 박호건 | hogunpark@skku.edu | LearnData Lab | https://learndatalab.github.io
-
- 작성일 2024-12-02
- 조회수 198
-
- [연구] [엄영익 교수] 분산컴퓨팅연구실, (문성재 석박통합과정 2기) SIGMOD 2025 논문 게재 승인
- [엄영익 교수] 분산컴퓨팅연구실, (문성재 석박통합과정 2기) SIGMOD 2025 논문 게재 승인 분산컴퓨팅연구실 (지도교수: 엄영익)의 문성재 (공동 1 저자, 석박통합과정 2기)의 논문이 데이터베이스 분야의 Top-tier 국제학술대회인 SIGMOD 2025 (ACM SIGMOD/PODS International Conference on Management of Data)에 게재 승인(Accept)되었습니다. 해당 논문은 2025년 6월에 독일 Berlin에서 발표될 예정입니다. [논문 정보] 제목: Boosting OLTP Performance with Per-Page Logging on NVDIMM 저자: 문성재, 이보현, 박종혁, 이상원 학회: ACM SIGMOD/PODS International Conference on Management of Data (SIGMOD 2025) [연구 내용] 플래시 SSD 기반의 관계형 DBMS가 OLTP 워크로드를 수행하는 경우, 작은 크기의 빈번한 업데이트는 DRAM에서 SSD로의 페이지 쓰기를 발생시켜 트랜잭션 처리량을 크게 제한합니다. 이 문제를 해결하기 위해 본 논문에서는 비휘발성 메모리 종류 중 하나인 NVDIMM (Non-Volatile DIMM)을 내구성 로그 캐시로 활용하여 DRAM에서 SSD로의 페이지 쓰기를 흡수하는 NV-PPL이라는 새로운 데이터베이스 아키텍처를 제안합니다. NV-PPL은 페이지 업데이트로 생성된 redo log를 캡처하여 소량의 NVDIMM에 페이지 별 업데이트 로그 (Per-Page Log, PPL)만 저장하여 SSD로의 페이지 쓰기 없이 데이터 내구성을 보장하며, System Failure로 인한 복구 시 PPL로 내구성이 보장된 페이지들은 Redo 및 Undo 과정을 회피하여 복구과정에서 발생하는 SSD로의 페이지 읽기/쓰기를 크게 감소시킵니다. 또한 PPL을 활용한 redo-based multi-versioning과 기존의 undo-based 방식을 결합한 Hybrid version reconstruction 방식을 통해 HTAP 환경에서 발생하는 undo-chaining에 의한 buffer pollution 문제를 해결하여 페이지 읽기/쓰기를 줄이고 Buffer Hit ratio를 높입니다. NV-PPL을 MySQL/InnoDB 엔진에 구현하여 실제 NVDIMM 장치에서 실험해 본 결과, 동일한 가격의 Vanilla MySQL에 비해 페이지 쓰기를 79%를 줄여 트랜잭션 처리량이 8.7배 향상되었으며, 페이지 단위 NVDIMM 캐싱 방식인 NV-SQL 대비 페이지 쓰기를 59%를 줄여 트랜잭션 처리량이 1.5배 향상되었음을 확인했습니다. 그리고 Vanilla MySQL 대비 복구 시간을 1/3로 줄였으며 HTAP 워크로드에서 Long-Lived Transaction(LLT)의 지연 시간을 최소 3배에서 최대 18배까지 개선했습니다.
-
- 작성일 2024-11-05
- 조회수 809
-
- [연구] [차수영 교수] 소프트웨어분석연구실(SAL), ICSE 2025 논문 게재 승인
- [차수영 교수] 소프트웨어분석연구실(SAL), ICSE 2025 논문 게재 승인 소프트웨어 분석 연구실 (지도교수: 차수영)의 이재혁 학생 (석사과정)의 논문이 소프트웨어공학 분야 최우수 학회인 ICSE 2024 (IEEE/ACM International Conference on Software Engineering)에 게재 승인(Accept) 되었습니다. 해당 논문은 2025년 4월에 캐나다 Ottawa에서 발표될 예정입니다. 본 논문 "TopSeed: Learning Seed Selection Strategies for Symbolic Execution from Scratch"은 대표적인 소프트웨어 테스팅 방법 “기호 실행(Symbolic Execution)”의 성능을 높이기 위해, 사전 지식 없이 좋은 “시드(Seed)”를 선택하는 전략을 제안한다. 기호 실행에서 “시드”는 비싼 SMT 풀이 비용 없이, 테스트할 프로그램의 코드를 효과적으로 탐험할 수 있도록 도움을 주는 역할을 한다. 그러나, 대부분의 최신 기호실행 기술들은 시드를 사용하지 않고 그 성능을 높이는데 초점을 맞추었다. 본 논문에서는 다양한 최신 기호 실행 기술들이 사전 지식 없이 좋은 시드를 선택할 수 있도록 도와주는 상호 보완적인 방법인 TopSeed를 제안한다. 실험적으로, TopSeed는 다수의 오픈소스-C 프로그램들에 대해 다양한 최신 기호 실행 기술들의 성능을 분기 커버리지(Branch Coverage)와 오류 검출 관점에서 크게 향상시키는데 성공하였다. [논문 정보] 제목: TopSeed: Learning Seed Selection Strategies for Symbolic Execution from Scratch 저자: 이재혁, 차수영 학회: IEEE/ACM International Conference on Software Engineering (ICSE 2025) Abstract: We present TopSeed, a new approach that automatically selects optimal seeds to enhance symbolic execution. Recently, the performance of symbolic execution has significantly improved through various state-of-the-art techniques, including search strategies and state-pruning heuristics. However, these techniques have typically demonstrated their effectiveness without considering “seeding”, which efficiently initializes program states for exploration. This paper aims to select valuable seeds from candidate inputs generated during interactions with any symbolic execution technique, without the need for a predefined seed corpus, thereby maximizing the technique's effectiveness. One major challenge is the vast number of candidates, making it difficult to identify promising seeds. To address this, we introduce a customized online learning algorithm that iteratively groups candidate inputs, ranks each group, and selects a seed from the top-ranked group based on data accumulated during symbolic execution. Experimental results on 17 open-source C programs show that TopSeed significantly enhances four distinct cutting-edge techniques, implemented on top of two symbolic executors, in terms of branch coverage and bug-finding abilities.
-
- 작성일 2024-11-04
- 조회수 752
-
- [학생실적] [SPARK] 2024년 메타버스 개발자 경진대회 장려상 수상
- [SPARK] 2024년 메타버스 개발자 경진대회 장려상 수상 박희선 산학교수가 지도하는 2024 SPARK팀이 '2024년 메타버스 개발자 경진대회'에서 수상했다. 과학기술정보통신부가 주최한 '2024년 메타버스 개발자 경진대회'는 창의적인 메타버스 서비스와 콘텐츠를 개발하는 K-디지털 챌린지이다. 금번 경진대회는 22개 기업의 후원과, 총 349팀이 참가해 발표 및 현장시연을 통해 최종 수상작 30점이 선정되었고, 13기 SPARK Studio:ON팀이 장려상(Meta 대표상)을 수상했다. 2024년 메타버스 개발자 경진대회 장려상 - 출품작 : Magic & Merge (모션 결합을 사용한 VR 액션 게임) > 주제 : VR 게임을 쉽게 즐길수 있도록 직관적인 수어 모션 인터페이스 제안 > 특징 1. 다양한 손 모션으로 스킬을 사용 2. 모션들을 쉽게 결합할 수 있는 콤보 스킬 시스템 제작 3. 사용자 친화적인 인터페이스와 게임 콘텐츠 제작 - 참가자 : 김진규(팀장), 김채리, 이시현, 장재원, 정헌영 (Studio:ON팀 소프트웨어학과 1~3학년) - 수상 내역 : 장려상 (기업 Meta 대표상) - 상금 : 300만원
-
- 작성일 2024-10-28
- 조회수 924
-
- [교수동정] [이호준 교수] 시스템보안연구실, ACM CCS 2024 Distinguished Paper Award 수상
- [이호준 교수] 시스템보안연구실, ACM CCS 2024 Distinguished Paper Award 수상 시스템보안연구실 (지도교수 이호준, https://sslab.skku.edu)의 임하정(박사과정), 김재윤(석박통합과정) 학생의 "uMMU: Securing Data Confidentiality with Unobservable Memory Subsystem" 논문이 보안 분야 4대 학회 중 하나인 ACM Conference on Computer and Comunnications Security (CCS) 2024 학회에서 Distinguished Paper Award를 수상하였다. Distinguished Paper Ward는 CCS'24에서 발표된 331편의 논문 중 28편에 수여되었다. 논문 요약: 현대 컴퓨팅 시스템의 메모리 계층 구조는 여러 종류의 보안 위협에 노출되어 있어 데이터 기밀성 보장이 계속해서 어려움을 겪고 있습니다. 공격자들은 다양한 강력한 공격 기법을 통해 중요 데이터를 직간접적으로 유출해왔으며, 새로운 공격들이 지속적으로 발견되고 있습니다. 안전하지 않은 언어로 작성된 프로그램에서의 메모리 안전 (Memory Safety)는 달성하기가 매우 어려워 공격으로 인한 비정상적인 메모리 접근이 직접적인 공격 경로로 사용되고 있습니다. HeartBleed와 같은 보안 사고가 이러한 공격의 대표적인 예시입니다. 최근에는 마이크로아키텍처 부채널 공격이 일반 프로그램뿐만 아니라 TEE(Trusted Execution Environment) 같은 기술로 보호된 프로그램의 데이터조차 유출 가능함을 증명하고 있습니다. 이 논문에서는 uMMU라는 새로운 프로세스 내 데이터 보호를 위한 메모리 서브시스템을 제시합니다. uMMU는 프로세서 레지스터를 관측할 수 없는 저장소로 사용하는 기법을 메모리 암호화 및 Oblivious RAM과 같은 데이터 기밀 보호 기술과 유기적으로 통합합니다. uMMU는 프로세서 아키텍처의 확장 레지스터(예: Intel x86의 AVX512)를 관측할 수 없고 주소 지정 가능한 물리 메모리로 추상화합니다. 가상 메모리 원칙을 완성하는 것은 암호화 또는 ORAM과 같은 메모리 기밀성 정책이 적용된 안전한 스왑 공간을 유지하는 메모리 관리입니다. uMMU는 민감한 데이터에 대한 데이터 기밀성 정책을 호스팅할 수 있는 범용적이고 강력한 데이터 보안 프레임워크입니다. 실험 결과에 따르면, uMMU는 민감한 데이터 보호를 위한 암호화 및 ORAM 스킴을 사용한 프로그램의 성능을 크게 향상시킵니다. MbedTLS의 민감 데이터 암호화 기반 보호에서 평균 69.93%의 성능 향상, 그리고 Memcached의 해시 테이블에서의 액세스 패턴을 숨기는 ORAM 기반 보호에서 497.84%의 성능 향상을 보였습니다.
-
- 작성일 2024-10-18
- 조회수 587
-
- [연구] [고영중 교수] 자연어처리연구실(NLP lab), EMNLP 2024 논문 게재 승인(2편)
- [고영중 교수] 자연어처리연구실(NLP lab), EMNLP 2024 논문 게재 승인(2편) 자연어처리연구실(NLP lab, 지도교수: 고영중)의 논문 2편이 인공지능 및 자연어처리 분야의 Top-tier 국제학술대회인 EMNLP 2024(The 2024 Conference on Empirical Methods in Natural Language Processing)의 Industry Track에 게재 승인되었습니다. 각 연구는 NAVER, NC Soft와 산학 협력을 통해 이루어졌습니다. 논문#1 Hyper-QKSG: Framework for Automating Query Generation and Knowledge-Snippet Extraction from Tables and Lists (인공지능학과 박사과정 김두영, 인공지능학과 석사과정 장윤진, NAVER 산학) 논문 요약: 본 연구에서는 지식스니펫의 커버리지를 자동으로 확장하는 프레임워크를 제안합니다. 지식스니펫이란 검색엔진에서 검색 결과 상단에 위치하는 짧은 단락으로, 사용자가 쿼리에 대한 정보를 검색된 문서를 읽을 필요 없이 얻을 수 있도록 편의성을 제공하는 역할을 합니다. 테이블이나 리스트와 같이 복잡한 웹 문서구조에서 지식스니펫을 추출하기 위해서, 기존의 자연어 텍스트 기반의 언어모델을 HTML 기반의 언어모델으로 재학습하였으며, 문서로부터 쿼리와 지식스니펫을 추출하는 파이프라인 시스템을 구축하였습니다. 또한 본 연구에서 자동으로 지식스니펫의 커버리지를 확장하는 과정에서 생성되는 다양한 노이즈 지식스니펫-쿼리 쌍에 대해서 필터링 및 개선 방법을 제안하였습니다. 실제 검색 환경에서 자동 확장된 지식스니펫 데이터베이스를 기반으로 정성평가를 진행한 결과 반환된 지식스니펫이 사용자 쿼리에 대해 유용한 정보를 제공할 수 있음을 보였으며, 기존에 테이블이나 리스트에서 지식스니펫을 뽑지 못하는 한계를 극복하고 다양한 HTML 구조에서 지식스니펫을 추출하여 정보를 제공할 수 있음을 보였습니다. Abstract: These days, there is an increasing necessity to provide a user with a short knowledge-snippet for a query in commercial information retrieval services such as the featured snippet of Google. In this paper, we focus on how to automatically extract the candidates of query-knowledge snippet pairs from structured HTML documents by using a new Language Model (HTML-PLM). In particular, the proposed system is powerful on extracting them from Tables and Lists, and provides a new framework for automate query generation and knowledge-snippet extraction based on a QA-pair filtering procedure including the snippet refinement and verification processes, which enhance the quality of generated query-knowledge snippet pairs. As a result, 53.8% of the generated knowledge-snippets includes complex HTML structures such as tables and lists in our experiments of a real-world environments, and 66.5% of the knowledge-snippets are evaluated as valid. 논문#2 RAC: Retrieval-augmented Conversation Dataset for Open-domain Question Answering in Conversational Settings (인공지능학과 박사과정 최봉근, 인공지능학과 석박통합과정 박정재, NC Soft 산학) 논문 요약: “RAC: Retrieval-augmented Conversation Dataset for Open-domain Question Answering in Conversational Settings” 논문은 NC Soft와 산학 협력을 통해 구축한 데이터셋을 소개합니다. 해당 데이터셋은 검색 기반의 대화형 질의응답 문제를 다루고 있으며, 구체적으로 대화 문맥 내에서 사용자의 질문에 대한 사실 기반의 응답을 하기 위해 문맥 기반의 질의 재작성, 문서 검색, 문서 재순위화, 응답 생성의 과정을 포함하고 있습니다. 특히, 기존의 대화형 질의응답 데이터들이 검색된 문서 내의 일부 단어 혹은 문장을 추출하여 응답으로 사용하는 반면, 검색된 문서를 반영하여 사람과 같은 자연스러운 응답을 생성할 수 있는 것을 목표로 하고 있습니다. 본 논문에서는 데이터셋과 함께 BM25와 한국어 Dense Retriever을 기반으로 한 문서 검색 성능 및 Ko-BART와 LLM(GPT-4o-mini)을 기반으로 한 응답 생성 성능을 Baseline으로 제공하고 있습니다. Abstract: In recent years, significant advancements in conversational question and answering (CQA) have been driven by the exponential growth of large language models and the integration of retrieval mechanisms that leverage external knowledge to generate accurate and contextually relevant responses. Consequently, the fields of conversational search and retrieval-augmented generation (RAG) have obtained substantial attention for their capacity to address two key challenges: query rewriting within conversational histories for better retrieval performance and generating responses by employing retrieved knowledge. However, both fields are often independently studied, and comprehensive study on entire systems remains underexplored. In this work, we present a novel retrieval-augmented conversation (RAC) dataset and develop a baseline system comprising query rewriting, retrieval, reranking, and response generation stages. Experimental results demonstrate the competitiveness of the system and extensive analyses are conducted to apprehend the impact of retrieval results to response generation. 고영중 교수: yjko@skku.edu, nlp.skku.edu, 자연어처리연구실: nlplab.skku.edu
-
- 작성일 2024-10-04
- 조회수 1180
-
- [연구] [우홍욱 교수] CSI 연구실, NeurIPS 2024 논문 게재 승인 (3편)
- [우홍욱 교수] CSI 연구실, NeurIPS 2024 논문 게재 승인 (3편) CSI연구실 (지도교수: 우홍욱)의 3편의 논문이 인공지능 분야 우수학회인 NeurIPS 2024 (Thirty-Eighth Annual Conference on Neural Information Processing Systems) 에 게재 승인(Accept) 되었습니다. 논문은 24년12월 캐나다 벤쿠버에서 발표될 예정입니다. 1. 논문 “LLM-based Skill Diffusion for Zero-shot Policy Adaptation” 은 소프트웨어학과 김우경 (박사과정), 이영석 (박사과정), 김주영 (학사과정) 연구원이 저자로 참여했습니다. 최근 계층적 스킬 기반 정책 학습 방법이 순차적 의사 결정 문제에 대응하는 데 인기를 얻은 반면, 해당 접근 방법은 다양한 자연어로 명시된 사용자의 요구사항에 제로샷(Zero-shot)으로 적응하는 데에는 한계가 있었습니다. 본 연구에서는 LLM의 코드 생성 능력과 손실함수로 제어 가능한 확산 모델(Diffusion Model)을 활용하여, 자연어로 명시된 컨텍스트에 제로샷 적응이 가능한 LDuS (LLM-based Skill Diffusion) 프레임워크를 제안합니다. LDuS는 도메인 변화가 심한 다중 모달리티 로봇 동작 환경에서, 기존의 모방 학습보다 우수한 적응성을 지닙니다. 2. 논문 “Exploratory Retrieval-Augmented Planning For Continual Embodied Instruction Following” 은 소프트웨어학과 유민종 (석박통합과정), 장진우 (석박통합과정) 연구원이 저자로 참여했습니다. 본 연구는 Non-stationary 물리 환경에서 하나가 아닌 여러 개의 지속적인 사용자 지시(Multiple Continuous Instruction Following)를 수행하는 임베디드 에이전트를 위한 탐색 기반 검색 증강 계획 (Exploratory Retrieval-Augmented Planning, ExRAP) 프레임워크를 제안합니다. 이 프레임워크는 최신 LLM의 추론 능력을 활용하여 에이전트가 동적이고 변화하는 환경에서 실시간으로 지시를 수행할 수 있도록 합니다. 이 과정에서 ExRAP은 환경 정보 메모리를 활용하여, 에이전트가 다중 지시의 조건을 이해하고, 이러한 조건에 맞추어 작업을 자원 효율적으로 계획하고, 물리 환경 특성에 맞추어 실행할 수 있습니다. 또한, 물리 환경과의 상호작용을 최소화하는 태스크 수행을 위하여, 정보 기반 환경 탐색을 통합적으로 수행합니다. 이를 통해, 환경 정보의 유효성을 보장하고 전체적인 에이전트의 작업 성능을 향상시킵니다. 3. 논문 “Incremental Learning of Retrievable Skills For Efficient Continual Task Adaptation” 은 소프트웨어학과 이대희 (석박통합과정), 유민종 (석박통합과정), 김우경 (박사과정), 최원제 (박사과정)연구원이 저자로 참여했습니다. 본 논문은 로봇 어플리케이션의 평생 모방학습 (Continual Imitation Learning, CiL)에서 발생하는 세 가지 주요 문제를 다룹니다: 1) long-horizon 환경에서의 전문가 데모 수집의 높은 비용과 비효율성, 2) 비정형적인 동적 환경에서의 적응력, 3) 개인정보 보호를 위한 Unlearning. 해당 연구는 프로토타입 기반 스킬 증분 학습을 통해 저수준 스킬을 이산적인 프로토타입으로 표현하고, 이를 통해 에피소드 재생 없이 행동 지식의 순방향 및 역방향 전이를 향상시키며, 비정형적인 CiL 환경에서 효율적인 작업 적응과 작업에 대한 즉각적인Unlearning을 가능하게 하는 IsCiL (Incremental skills for continual imitation learning) 프레임워크를 제안합니다. Franka-Kitchen과 Meta-World 실험을 통해 IsCiL프레임워크는 새로운 작업에 대한 적응력과 unlearning 시나리오에서의 기능적 특성을 입증하며, 기존 방법들보다 우수한 성능을 보였습니다. CSI 연구실은 머신러닝, 강화학습, 자기지도학습, LLM 활용을 통해, (1) 체화형 에이전트 (Embodied Agent) (2) 평생학습 성장향 에이전트 (Lifelong Learning Agent) (3) 드론, 클라우드, 자율주행 시스템 최적화 연구를 수행하고 있습니다. 이번 논문의 연구는 사람중심인공지능 핵심원천기술사업 (IITP), 한국연구재단 개인기초사업 (NRF), 인공지능대학원, ICT명품인재양성사업, BK21 FOUR 사업(BK21), 삼성전자 지원으로 진행 중 입니다. 우홍욱 | hwoo@skku.edu | CSI Lab | https://sites.google.com/view/csi-agent-group
-
- 작성일 2024-09-30
- 조회수 1466
-
- [연구] [우홍욱 교수] CSI 연구실, EMNLP 2024 논문 게재 승인
- [우홍욱 교수] CSI 연구실, EMNLP 2024 논문 게재 승인 CSI연구실 (지도교수: 우홍욱)의 논문이 인공지능 분야 우수학회인 EMNLP 2024 (The 2024 Conference on Empirical Methods in Natural Language Processing) 에 Findings 게재 승인(Accept) 되었습니다. 논문은 24년 11월 미국 플로리다에서 발표될 예정입니다. 논문 “LLM-Based Offline Learning for Embodied Agents via Consistency-Guided Reward Ensemble” 은 소프트웨어학과 신상우 (석사졸업), 이유정 (석사과정) 이 제1저자로 참여했으며, 아크릴 박외진 C박사가 공저자로 참여했습니다. 본 연구는 로봇 에이전트와 사용자간 명령형 대화에 기반하여 지시된 태스크 (Embodied Instruction-Following, EIF)를 수행할 때, 초거대언어모델 (LLM)을 활용하여 시공간적 일관성과 물리 환경에 기반한 보상(Reward)을 구성하는 CoREN(consistency-guided reward ensemble framework) 기법을 제안합니다. CoREN은 추가적인 환경 상호작용 없이 오프라인 데이터를 활용하여, LLM을 기반으로 문맥적, 구조적, 시간적 일관성을 갖춘 보상을 생성합니다. 이러한 보상들은 환경 기반 보상으로 조합되어 에이전트의 학습에 활용되며, 에이전트는 지정된 태스크에 맞는 스킬 실행 계획을 효과적으로 수립하고 수행합니다. CoREN은 홈 로봇 에이전트 테스트 환경인 VirtualHome 벤치마크의 실험을 통해, 다양한 EIF 시나리오와 동적 환경 변화에 대해 SOTA 대비 강건한 성능을 낼 수 있음을 보여주었습니다. CSI 연구실은 머신러닝, 강화학습, 자기지도학습을 활용하여 네트워크, 클라우드 시스템 최적화 연구와 로봇, 드론 자율주행 연구 등을 수행하고 있습니다. 이번 EMNLP 2024 논문의 연구는 사람중심인공지능 핵심원천기술사업 (IITP), 한국연구재단 개인기초사업 (NRF), 인공지능대학원, ICT명품인재양성사업, BK21 FOUR 사업(BK21), 정보통신기획평가원, 삼성전자 지원으로 진행 중 입니다. 우홍욱 | hwoo@skku.edu | CSI Lab | https://sites.google.com/view/csi-agent-group
-
- 작성일 2024-09-27
- 조회수 1488