《向量数据库指南》——Milvus Cloud向量数据库的新认知
除了在数字领域取得的显著成就外,在2023年业务模式的转变中还带来了丰富的定性认识。这些认识不仅促进了我们对向量这一数据类型的深入理解,并且推动了我们对未来向量数据库发展路径的探索。

- 大模型应用仍处于初期阶段:避免重蹈智能手机时代“手电筒应用”的覆辙
回溯移动互联网的早期发展时期,在那个阶段许多开发者都曾尝试过构建诸如手电筒这类简单的应用程序或是天气预报工具等小巧 yet 简单的应用程序。随着时间推移这些最初的概念性应用最终都被成功的整合进了智能手机的操作系统架构之中。当下人工智能技术迅速发展的背景下出现了许多令人注目的开源项目例如在GitHub上迅速积累超过10万颗星标的AutoGPT项目然而这些项目虽然展现了技术探索的价值却尚未真正实现实质性的经济价值仅可视为人工智能技术探索过程中的阶段性成果。这一观察结果预示着基于生成式人工智能(AIGC)的技术框架的大模型与向量数据库的应用仍处于一个初级发展阶段。就当前情况来看围绕向量数据库的技术探讨可能仅限于AI技术转型过程中的第一波浪潮性探索而真正具有里程碑意义的应用仍有待于未来的发展与完善。
- 向量数据库持续分化
如同数据库发展出OLTP、OLAP以及NoSQL等多种形态般,在2023年时向量数据库展现出多样化的发展态势。突破传统在线服务的范畴界限,在离线分析方面的重要性愈发凸显,并已形成专门的向量数据库系统布局数据预处理与分析环节。GPTCache作为我们在2023年推出的开源项目,在于通过缓存技术实现大模型输出能力的同时也为向量数据库开辟了全新的应用场景——缓存赛道。展望未来我们充满信心地期待着来年在更多样化的应用场景和技术设计上取得长足的进步
- 向量语意的复杂性日增

ANN并非专为向量数据库设计的独特属性。尽管如此,许多观点认为,仅支持最近邻搜索便可将系统归类为向量或AI原生数据库,这种看法并不完全准确,因为实际操作远超预期水平。除标量过滤与混合查询外,专为AI原生应用场景定制的数据库还应具备以下高级语义功能:包括但不限于基于NN(近邻)过滤、KNN(k近邻)联接以及集群查询等多种复杂操作
- 对于 AI 原生应用而言,高弹性至关重要,但向量数据库可能成为瓶颈
类似于ChatGPT这类的AI应用,在短短两个月内实现了月活用户突破一亿;其增长速度远高于其他任何业务领域的发展节奏。一旦进入加速发展阶段,在一百万至十亿的数据点范围内实现快速扩展变得尤为关键;得益于大型模型提供商提供的按需付费的服务模式;以这种方式存储向量数据不仅有利于开发者的使用体验和效率提升;而且相较于传统的大型模型和依赖项而言;这种数据库的核心优势在于它通过维护状态来实现功能;然而这种特点同时也带来了可扩展性和弹性的更高要求;因此在选择适合的应用场景时;开发者必须充分考虑弹性和可扩展性这两个关键指标

- 将机器学习应用于向量数据库可以带来惊人的高回报
在2023年这一年里,我们对AI4DB进行了大规模投资,并获得了显著的收益.相较于传统数据库而言,向量数据库的独特之处在于其固有的不精确性,这使得它特别适合应用于机器学习算法以实现优化.为此,我们特意引入了两项核心功能:一项是基于机器学习实现自动生成索引(AutoIndex)的能力;另一项则是通过数据聚类实施分区策略的能力.这些创新举措都成功地将Milvus企业版在云端的应用搜索性能得到了明显提升.
- 开源与闭源
在大型语言模型领域中,在生成式人工智能技术方面表现最为突出的当属OpenAI与Claude等闭源模型系统占据绝对优势地位;而开源社区则面临着计算资源与数据获取等方面的限制仍在艰难探索前行。就数据库系统而言,在这一领域中我认为开源必将成为用户最理想的选择;因为这不仅能够提供更为多元化的应用场景而且能够推动技术迭代速度加快更重要的是开放性带来的透明度使得用户能够更好地理解并掌握数据库系统的运行机制从而实现更加高效合理的应用。
- 新的开始
随着主流的大规模AI技术变革进程快速消逝,在向量数据库的发展进程中仍处于早期阶段。对于被归类为非传统向量数据库的Milvus而言,在这场变革浪潮中并未迷失方向。
与我们而言,在研发过程中最关注的是精研并打磨我们的产品,并筛选并发展最适合我们需求的应用场景。尽心服务于我们认为理想化的一群用户。希望通过开源理念拉近与用户的距离,并让每一位无论身处何地的人都能感受到我们的善意与专业精神。
在2023年这一年中,出现了众多新的人工智能初创企业,并在各自领域完成了首次融资.目睹了这些开发者们的创新行为确实令人感到兴奋,这让我回想起自己当初为什么会选择深入研究向量数据库领域.预计这一年将成为所有这些创新应用真正走向主流的重要一年,不仅会引来投资方的关注与支持,在市场中也会产生稳定的客户群体.这也意味着对这些开发者提出了更高的技术挑战与需求……新的一年,我们顶峰相见!
