5月8日,火山引擎正式发布 DiskANN+RaBitQ 向量算法引擎,旨在解决大模型时代向量数据库“高性能、大规模、低成本”的核心需求,目前已开启邀测。
该向量算法引擎通过深度融合 DiskANN 算法与 Extended RaBitQ 向量量化技术,在高性能向量检索场景,查询性能较 HNSW 算法查询性能提升115%,内存资源消耗降低90%,用户向量数据库整体成本降低75%,为企业业务发展的不同时期提供高性价比、可平滑演进的向量检索方案,加速 AI 技术在各行业落地应用。
2024年,火山引擎云搜索团队就发现了 DiskANN 算法在市场需求中的潜力,推出高性价比的百亿级海量向量数据检索方案。DiskANN 和 HNSW 都是向量检索的优秀算法,HNSW 就像一座复杂的多层迷宫,凭借多层结构设计,能让计算机快速找到目标数据,但数据需要在多层迷宫里频繁检索,这就要求数据需要存放在高性能存储介质上,一旦数据量增大,硬件开销就会直线上升。而 DiskANN 则是单层图设计,天生适合把数据存在硬盘里,这就大大降低了存储成本,不过,在一些对检索性能要求高的场景下,它的速度还不够快。

随着企业业务的发展,新问题出现了,单纯的高性价比存储方案无法满足所有需求,而让企业切换到 HNSW 等高性能算法,又会带来数据格式不兼容、数据使用频率差异大、技术方案不能灵活升级等问题。
为解决这些难题,火山引擎云搜索团队决定深挖 DiskANN 算法的潜力,将其升级为集“大容量+高性能”于一体的统一算法引擎:
- 超大规模低成本方案:通过优化硬盘索引技术,用硬盘代替内存存储索引数据,资源成本比全内存方案降低95%以上,轻松解决海量数据“存不起”的难题,适合长期存储监控视频、图片等大量非结构化数据。
- 高性能场景算法方案:把常用索引数据存到内存里,搭建高速检索通道,让查询速度比传统 HNSW 算法提升54%,既能保持较低成本,又能满足实时推荐、即时问答等场景的快速检索需求。
- 智能混合模式方案:利用两种模式共享索引数据的特性,自动区分高频和低频数据——常用数据放内存快速查,不常用数据放硬盘省成本,在不增加硬件投入的情况下,查询延迟降低60%,灵活平衡不同业务时段的速度与成本需求。
- 高性能场景算法升级:采用学术界最新向量量化技术 Extended RaBitQ,在保证检索准确率超94%的同时,将内存使用量减少90%,向量数据库整体成本降低75%,相比 HNSW 算法查询性能提升115%。
DiskANN+RaBitQ 向量算法引擎的发布,标志着向量数据库从“用户业务系统适配多引擎”向“引擎平滑适配业务系统演进”的跨越,企业无需为不同业务场景选择不同的引擎,也不需要为业务在不同发展阶段切换引擎,同一套技术架构可以在近乎无感的情况下同时支持:
- 高性能场景:如电商实时推荐系统,通过内存加速实现毫秒级商品向量检索,提升用户体验;
- 大规模场景:如自动驾驶海量路测数据存储,利用磁盘存储降低长期归档成本;
- 混合场景:如智能客服 RAG 系统,热点问题通过内存快速响应,历史知识库依托磁盘高效存储,实现成本与性能的最优配比。
火山引擎通过技术创新而非简单方案堆叠,为企业提供了“一次技术选型,业务发展全周期需求覆盖”的能力,随着业务发展,企业可以根据业务实际需求,从容在成本和性能模式之间快速切换。目前已在信息服务、科研、法律、餐饮、智能制造等行业实现规模化应用,从落地客户案例来看,采用该引擎的企业平均研发周期缩短40%,运维成本降低50%。
版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。