《向量数据库指南》:向量数据库Pinecone索引
目录
Pods、pod类型和pod大小
入门计划
s1 pods
p1 pods
p2 pods
Pod大小和性能
Distance metrics
本文档阐述了与Pinecone 索引相关的核心概念。您若想了解如何创建或修改索引,请参考此处:管理索引。
Pinecone向量数据采用索引来实现最有效的组织管理。该系统不仅负责接收和存储这些高维矢量化数据,并且能够对它们进行快速检索;同时支持基于这些矢量的数据运算功能。在实际应用中,默认情况下每个索引都会被部署到单个Pod上运行。

Pods、pod类型和pod大小
Pods是预先配置好的硬件设备,专门用于运行Pinecone服务.每个索引通常部署在一个或多个Pode上.Pod数量增加通常意味着存储容量提升、延迟降低以及吞吐量提高.这些硬件设备的不同规模版本允许您根据需求进行调整.
当您使用指定的Pod类型构建索引时,则无法修改该索引所属的Pod类型。然而,您还可以选择其他Pod类型,并通过访问这个链接来创建新索引。
各类型Pod的收费水平各有差异。如需获取更多信息,请参考[价格](https://www.pinecone.io/pricing/ "价格")。
入门计划
在使用该入门计划时,在创建一个Pod的过程中拥有充足的资源支持存储超过1万份向量(10,000+),其中包含高维(1536维)分布式嵌入和丰富的元数据信息;而对于更高维度的空间需求,则会根据实际需求自动扩展至更高维度空间。
当采用入门计划进行操作时,在此过程中所有的 [create_index] 调用将不会考虑 pod_type 参数。
s1 pods
这些优化存储的pod能够支持海量存储容量,并且整体成本显著降低。然而,在查询响应时间上稍逊于p1 pods,在这种情况下特别适合那些中等或宽松查询响应时间的需求场景。
每个s1 pod的容量足够存储约5M个768维向量。
p1 pods
经过性能优化设计的 pod 具备极低的查询延迟能力;然而, 每个 pod 所存储的向量数量相较于 s1 pods 显著减少. 这种配置专为那些对查询响应时间有严格限制且小于 100 毫秒的应用而设计.
每个p1 pod的容量足够存储约1M个768维向量。
p2 pods
当查询数据维度低于128且topK值小于50时,在使用p2 pods架构时,默认情况下每个replica能够高效处理高达每秒200次查询请求,并在仅需10毫秒的时间内完成响应。这表明,在相同的硬件配置下与s1、p1 pod类型相比,在吞吐量与延迟方面均有显著提升。
每个p2 pod的容量约为1M个768维向量,但是容量可能因维度而异。
相比而言,在数据吞吐能力方面 p2 pods 的表现明显不如 p1 pods。当处理空间维度不断增加时,在数据吞吐能力方面 p2 pods 的表现明显不如 p1 pods。值得注意的是,在吞吐能力和查询响应时间方面存在显著差异。在处理 128 维向量时,在单位时间内可完成高达 300 个更新操作;而对于更高维度的数据集(如 768 维及以上),该方法仍能保持较高的处理效率。建议您通过实际测试来验证其性能表现。
p2 pod类型不支持稀疏向量值。
Pod大小和性能

该Pod类性能呈现多样性的特点。建议您采用自建数据集的方法进行测试,并分析工作负载行为指标以评估该pod类型的表现。
每种 pod 类型都提供四种可用的 pod 尺寸规格:包括 x1、x2、x4 和 x8 大小的 pod。每当 pod 尺寸进行升级时,系统的索引存储能力和计算处理能力都会翻一番。系统默认设置为最小的 pod 尺寸(x1)。在创建索引之后,您可以逐步升级 pod 的大小。
为了更好地调整索引中的pod尺寸,请参考管理索引。
Distance metrics
创建向量索引时,可以选择不同的度量方法:
- euclidean
该算法旨在计算二维空间内任意两点间的直线长度,在数据分析和机器学习领域中具有广泛应用。关于具体的实现细节,请参考我们的图像相似度搜索示例。
在欧几里得距离设置下,系统将优先返回与查询样本最为接近的数据点,在这种情况下,返回的样本将具有最低的匹配得分值。
-
cosine
-
- 常用于查找不同文档之间的相似性。其优点是得分归一化到[-1,1]范围内。
-
dotproduct
用它来计算两个向量之间的点积;这个工具可以帮助我们了解两个向量之间的相似性程度;当点积结果越高时,这两个向量的方向就越趋近于一致。
为了自定义索引所需的完整参数列表,请参考create_index API参考。
根据您的应用程序需求,在召回率和精确度方面某些度量方法优于其他度量方法。有关更多信息,请参考:什么是向量相似性搜索?)
