우수국제학술대회 IEEE International Symposium on Cluster, Cloud, and Internet Computing (CCGRID) 2026 정규 발표 논문 채택
데이터 중심 컴퓨팅 및 AI 시스템 연구실 (DISCOS) 석사과정 김기환 (제1저자/지도교수 김영재 교수), 유형선 (공동 1저자/지도교수 김영재 교수), 김우중 (연구실 인턴), 민동현 (박사과정), 양지훈 교수(공동저자), 김영재 교수 (교신저자)가 작성한 “VEX: Scaling HNSW-Based Vector Search with DPU Memory and Parallelism" 논문이 The IEEE International Symposium on Cluster, Cloud, and Internet Computing (CCGRID) 2026 에 게재가 확정되었습니다. 올해 총 247편의 논문이 제출되었으며, 이 중 62편이 Long 정규 논문으로 채택되었다 (Acceptance rate는 25.1%).
최근 검색 증강 생성(RAG), 추천 시스템, 멀티모달 AI 등 다양한 AI 서비스에서 벡터 유사도 검색(Vector Similarity Search)은 핵심 인프라 기술로 자리 잡고 있습니다. 특히 HNSW(Hierarchical Navigable Small World)는 높은 정확도와 낮은 지연시간을 동시에 달성하는 대표적인 그래프 기반 ANN(Approximate Nearest Neighbor) 알고리즘으로 산업 전반에서 널리 활용되고 있습니다. 그러나, HNSW는 그래프 연결 정보와 고정밀 벡터 데이터를 모두 메모리에 상주시켜야 하므로, 데이터 규모가 수천만~수억 개 수준으로 증가할 경우 수백 GB 이상의 메모리를 요구하게 됩니다. 메모리 부족 상황에서 디스크 스왑이나 SSD 기반 접근이 발생하면, 불규칙한 그래프 탐색 특성으로 인해 심각한 성능 저하(처리량 급감 및 지연 시간 증가)가 발생하는 문제가 있습니다.

그림 1. DPU 메모리를 활용하여 HNSW 인덱스를 분할 배치하고, 호스트 CPU와 DPU ARM 코어를 통한 병렬 벡터 유사도 검색을 수행하는 VEX 시스템 아키텍처.
본 연구팀이 제안한 VEX 시스템은 이러한 대규모 벡터 검색 환경의 메모리 병목 문제를 해결하기 위해, 최신 SmartNIC/DPU의 메모리와 ARM 코어를 활용하는 새로운 3계층 메모리 구조를 제안합니다. VEX는 K-means 클러스터링과 PCA 기반 클러스터 정렬을 통해 벡터 공간의 의미적 구조를 보존하면서 인덱스를 Host와 DPU에 분산 배치합니다. 또한, Host-DPU 간 통신에서 반복적인 DMA 설정 오버헤드를 제거하기 위해 사전 등록된 링 버퍼 기반 구조를 설계하여 데이터 이동 비용을 최소화하며, Host와 DPU 의 연산 성능 차이로 발생하는 불균형을 완화하기 위한 파이프라인을 설계하여 전체 시스템 활용도를 극대화합니다.
실험 결과, 메모리 제약 환경에서 VEX는 기존 디스크 기반 ANN 시스템(DiskANN) 대비 최대 5-10배 높은 처리량(QPS)을 달성하면서도 안정적인 재현율을 유지하였습니다. 또한, 인덱스가 Host 메모리에 모두 상주하는 이상적인 환경에서도 DPU 병렬성을 활용하여 기존 in-memory HNSW 대비 최대 1.9배 높은 검색 처리량을 달성하였습니다. 이는 DPU를 단순한 네트워크 오프로딩 장치가 아닌, 실질적인 메모리 확장 및 병렬 검색 실행 계층으로 활용할 수 있음을 실증적으로 보여주는 결과입니다.
본 논문의 제1저자인 김기환 석사과정은 "최근 AI 서비스는 점점 더 대규모 벡터 데이터를 실시간으로 처리해야 하는 환경으로 발전하고 있습니다. 그러나 메모리 한계와 스토리지 지연 문제는 여전히 중요한 병목 요소입니다. VEX는 DPU를 단순한 네트워크 가속기가 아니라, 메모리 확장 계층이자 병렬 검색 엔진으로 재정의한 연구입니다.
저는 AI 모델 자체의 발전뿐 아니라, 이러한 모델을 실제 대규모 환경에서 효율적이고 확장 가능하게 서비스할 수 있도록 만드는 시스템 연구가 앞으로 더욱 중요해질 것이라고 생각합니다. 이처럼 AI와 시스템 아키텍처가 융합되는 연구 분야에 학부생 여러분의 많은 관심과 도전을 기대합니다.” 라고 소감을 전했습니다.
IEEE CCGRID는 클러스터, 클라우드 및 인터넷 컴퓨팅 분야의 세계적인 국제 학술대회로, 대규모 분산 시스템 클라우드 인프라, 고성능 컴퓨팅, 데이터 집약적 시스템 연구의 최신 성과를 공유하는 권위 있는 학회로 올해 행사는 5월 18일부터 21일까지 호주 시드니에서 개최될 예정입니다.
[참고자료]
The 26th IEEE International Symposium on Cluster, Cloud, and Internet Computing (CCGRID`2026)