Advertisement

《向量数据库指南》——AI原生向量数据库Milvus Cloud 2.3新功能

阅读量:

New Feature

Upsert 功能

允许用户通过 upsert 接口进行数据更新或插入操作。
已知限制条件:自增键无法采用 upsert 接口;upsert 实际上是基于删除-插入模式实现的。
因此会导致性能上的一定消耗。
当确定用于写入数据时,请继续使用 insert 操作。

该系统允许用户根据输入参数设定 search 的 distance 值来进行检索,并返回所有与目标向量距离落在特定区间内的数据项。

该系统允许用户根据输入参数设定 search 的 distance 值来进行检索,并返回所有与目标向量距离落在特定区间内的数据项。

复制代码
 // add radius and range_filter to params in search_params

    
 search_params = {"params": {"nprobe": 10, "radius": 10, "range_filter" : 20}, "metric_type": "L2"}
    
 res = collection.search(
    
     vectors, "float_vector", search_params, topK,
    
     "int64 > 100", output_fields=["int64", "float"]
    
 )
    
    
    
    
    AI助手

在这一实例中会生成距离介于10至20之间的向量。值得注意的是各个metric采用不同的计算距离的方法因此它们的范围和排序规则各有不同需要详细了解每个 metric 的特点之后再使用此功能此外请注意RangeSearch功能最多只能返回不超过16384条的结果

Count 接口

在计算 collection 数据量时(某些情况下)一些用户仍会选择手动调用 num_entities 接口(该接口需手动flush后才能得到精确数据)。然而频繁地执行flush操作会导致多个小文件频繁地被重写(这一行为会对 performance 和 stability 造成显著影响)。此次版本引入了 count(*) 表达式(该功能可实时获取 collection 的数据量信息)。值得注意的是 count 操作占用较多资源(因此在高并发场景下应谨慎使用)。

Cosine metrics

在大模型领域中,Cosine 距离的应用极为广泛。尤其是在这一领域的相关研究中,“余弦相似度”几乎成为了衡量两个向量之间近似程度的核心指标。值得注意的是,在 Milvus 2.3.0 版本中,“余弦相似度”的计算已经实现了内置支持。这使得研究人员和开发者无需再进行复杂的向量归一化处理即可直接利用这一强大的相似性评估工具。

查询返回原始向量

考虑到查询效率的需求,在旧版本中,Milvus尚未支持返回原始向量数据。此次版本更新已实现这一功能。值得注意的是,返回包含原始向量的数据将导致额外一次查询,这将显著影响系统的性能表现。对于性能关键路径的应用场景,建议采用HNSW索引结构或IVFFLAT等方法构建包含完整数据信息的索引系统以确保最佳运行效果

现在表明某些量化方法如 IVFPQ、IVFSQ8 无法直接获取原始向量信息;具体有哪些量化索引支持返回原始向量可通过以下链接进一步了解:https://github.com/zilliztech/knowhere/releases

全部评论 (0)

还没有任何评论哟~