우수국제학술대회 HiPC 2025 정규 발표 논문 채택
우수국제학술대회 International Conference on High Performance Computing, Data, and Analytics (HiPC) 2025 정규 발표 논문 채택

<정연우 박사과정>
데이터 중심 컴퓨팅 및 AI 시스템 연구실(DISCOS)의 정연우(1저자), 조현지(석사과정), 박규리(박사과정), 김영재 교수, 박성용 교수(교신저자)가 작성한 "CALL: Context-Aware Low-Latency Retrieval in Disk-Based Vector Databases"이 제32회 International Conference on High Performance Computing, Data, and Analytics (HiPC 2025)에 게재 확정되었습니다.
최근, 대규모 벡터 인덱스를 고속 저장 장치에 저장하고, ANN(Approximate Nearest Neighbor) 탐색 시 필요한 인덱스 군집만 동적으로 메모리에 적재하는 디스크 기반 벡터 탐색이 각광받고 있습니다. 벡터 데이터베이스는 ANN 탐색 과정에서 디스크 I/O를 줄이기 위해 인덱스 군집들을 메모리에 캐싱합니다. 그러나, 벡터 검색 쿼리 별로 동일한 인덱스 군집들을 탐색하는 패턴이 존재하므로, 이를 고려하지 못한 캐싱 전략은 캐시 활용률을 극대화하는데 한계로 작용합니다.
본 연구팀은 벡터 데이터베이스에서 사용되는 기존 인덱스 군집 캐싱 정책의 성능적 한계를 분석하고, 캐시 활용률을 극대화하기 위한 CALL을 제안하였습니다. CALL은 쿼리 별 인덱스 군집 집합의 유사도를 런타임에서 계산하여 군집이 겹치는 비율이 높은 쿼리들을 그룹으로 묶고 검색 순서를 재배치하였습니다. 또한, 그룹 내 쿼리 별 인덱스 군집 분포를 기반으로 쿼리 그룹이 바뀌기 전 비동기 군집 프리페칭 기법을 통해 다음 쿼리 그룹의 첫번째 쿼리가 탐색하는 인덱스 군집을 미리 캐시에 로드하여 캐시 적중률을 향상시켰습니다.

제안된 CALL은 대표적인 벡터 탐색 엔진인 FAISS에 구현되었으며, 실험 결과 기존 캐싱 기법 대비 꼬리 지연이 33% 이상 감소하였고, 캐시 활용률 역시 안정적으로 유지되었습니다.
정연우 박사과정은 “벡터 탐색 엔진에서 시스템-레벨의 성능 병목을 분석하고 극복하는 과정에서 많은 도전 과제가 있었지만, 시스템 프로그래밍에서 배운 여러 기법들을 활용하여 성능 향상을 이루게 되어 매우 뜻깊게 생각합니다. 많은 학생들이 요즘 유행하는 AI 응용을 시스템 관점에서 최적화하여 성능을 개선하는 시스템 소프트웨어 연구의 매력과 성취감을 얻을 수 있기를 바랍니다.”라고 소감을 전했습니다.
HiPC는 고성능 컴퓨팅 및 데이터 분석 분야의 최신 연구 동향과 기술 혁신을 논의하는 권위 있는 국제 학회로, 올해는 2025년 12월 17일부터 20일까지 인도 하이데라바드에서 개최됩니다. 또한 HiPC는 BK21 플러스 사업 CS 분야 우수국제학술대회(BK=1)에 등재되어 있습니다.
참고자료:
- The 32st IEEE International Conference on High Performance Computing, Data, and Analytics (HiPC25)
- Website : https://hipc.org
- Paper: https://discos.sogang.ac.kr/file/2025/intl_conf/HiPC_2025_Y_Jeong.pdf