Infinity 数据库 0.2 版本推出了稀疏向量和张量数据类型,实现了全文搜索、向量搜索和张量搜索的多路召回和混合搜索功能,大幅提升了 RAG 系统的检索质量。文章强调了单纯向量搜索在精确语义表达上的局限性,并介绍了如何通过混合搜索(全文搜索与稀疏向量搜索结合)来优化搜索结果。此外,文章还探讨了 ColBERT 排序模型的特点,以及如何在 Infinity 中实现端到端的 ColBERT 应用,包括 Tensor 数据类型的支持和对超长文本的处理方案。通过对 MLDR 数据集的评测,Infinity 展现了其在性能和排序质量上的优异表现,特别是在与 Elasticsearch 的对比中,Infinity 表现出卓越的全文搜索性能。