우수국제학술대회 The IEEE International Symposium on Cluster, Cloud, and Internet Computing (CCGRID`2026) 정규 발표 논문 채택
데이터 중심 컴퓨팅 및 AI 시스템 연구실 (DISCOS) 석사과정 박재완 (제1저자/지도교수 김영재 교수), 민경욱 (석사과정), 변성진 (석사과정), 노태완 (석사과정), 박현기 (학부연구생), 김영재 교수 (교신저자)가 작성한 “BucketLSM: Breaking the Compaction Scalability Barrier in LSM-Based Key-Value Stores" 논문이 IEEE International Symposium on Cluster, Cloud, and Internet Computing (CCGrid`2026)에 게재가 확정되었습니다. 올해 총 247편의 논문이 제출되었으며, 이 중 62편이 Long 정규 논문으로 채택되었다 (Acceptance rate는 25.1%).
현대의 다양한 클라우드 서비스, 검색 엔진, 데이터베이스, 인공지능 시스템들은 방대한 데이터를 빠르게 저장하고 처리하는 Key-value 기반 저장 시스템을 기반으로 동작합니다. RocksDB와 같은 LSM-tree 기반 저장 시스템 또한 Data를 단순히 Key-value의 쌍으로 저장하여 빠르게 저장하고 처리하지만, 쓰기 작업이 몰리는 상황에서는 데이터 정리 작업으로 인하여 갑작스러운 지연이나 성능 저하가 반복적으로 발생하는 문제가 존재해 왔습니다.

그림 1. BucketLSM의 architecture overview
본 연구는 LSM-tree 기반의 대규모 데이터 저장 시스템에서 반복적으로 발생하는 성능 저하의 원인이 단순한 자원 부족이 아니라, 데이터가 처음 디스크에 저장되는 Level-0 단계의 구조적 한계에 있음을 밝혔습니다. 이를 해결하기 위해 연구팀은 Level-0을 여러 개의 독립적인 버킷으로 분할하는 새로운 저장 구조인 BucketLSM을 제안하여, 데이터 저장 초기 단계부터 정리 작업을 병렬로 수행할 수 있도록 설계했습니다.
실험 결과, BucketLSM은 기존 RocksDB 대비 쓰기 처리 성능을 최대 2.6배 향상시키고, 시스템 성능 저하의 주요 원인이던 쓰기 중단(write stall) 현상을 크게 감소시켰고, 쓰기 작업이 많은 상황에서도 읽기 지연이 안정적으로 유지되어, 대규모 데이터 처리 환경에서의 실효성을 입증했습니다. 해당 연구는 단순한 성능 튜닝을 넘어 LSM-tree 저장 구조 자체를 재설계함으로써 병렬성을 근본적으로 확장한 연구로, 클라우드 인프라와 대규모 데이터베이스, AI 서비스 백엔드 등 실제 산업 환경에 폭넓게 적용될 수 있는 방향을 제시합니다.
본 논문의 제1저자인 박재완 석사과정은" LSM-tree의 성능 문제는 단순한 구현 최적화로 해결하기 어렵고, 구조적인 재설계가 필요하다는 문제의식에서 연구를 시작했습니다. BucketLSM은 기존 시스템의 병목을 정확히 짚고, 병렬성을 구조적으로 확장하는 방향을 제시합니다.
앞으로도 실제 대규모 스토리지 시스템에서 의미 있는 성능 향상을 이끌어낼 수 있는 시스템 구조 연구를 지속하고 싶습니다. 또한 수업에서 배우는 자료구조와 운영체제, 시스템 개념들이 실제 산업 문제로 어떻게 이어지는지를 직접 경험할 수 있는 분야입니다. ” 라고 소감을 전했습니다.
IEEE CCGRID는 클라우드 컴퓨팅, 분산 시스템, 고성능 컴퓨팅, 인공지능 분야 관련 최신 기술과 실제 적용 사례에 대한 근본적인 발전을 교류하고, 새로운 연구 주제를 발굴하며, 클라우드 컴퓨팅의 미래를 정의하는 것을 목표하는 학회로 올해 행사는 5월 18일부터 21일까지 호주 시드니에서 개최될 예정입니다.
[참고자료]
The 26th IEEE International Symposium on Cluster, Cloud, and Internet Computing (CCGRID`2026)