极智芯 | 解读国产AI算力 燧原产品矩阵
欢迎关注我的公众号 [极智视界],获取我的更多经验分享
大家好,我是极智视界,本文分享一下 解读国产AI算力 燧原产品矩阵。
诚挚邀请您加入我的知识星球「极智视界」!这个平台汇聚了大量优质的学习资源和实用项目代码。在这里您不仅可以获取丰富的资源库还会接触到许多前沿的技术应用案例。点击下方链接即可轻松访问:https://t.zsxq.com/0aiNxERDq
燧原于2018年创立并迅速发展,在AI芯片领域已小有建树。其产品线主要包含云燧系列中的10号系与20号系两款芯片产品,并搭配了软硬件协同优化的软件栈支持。从一个角度看, Alice认为, 这正说明该公司的实力已达到某种程度的成熟阶段——他们不仅具备相比单一芯片设计能力更强的优势,而且在系统集成方面也表现出色.这一观点得到了大多数国产AI芯片厂商的认可与认同,因为他们都深知只有将硬核技术与完善的支持体系相结合才能真正释放出产品的价值.
以下具体阐述了燧原提供的系列化解决方案中包含的主要芯片类硬件产品类型。作为主要专注于芯片领域的公司之一,在该领域的产品布局上具有显著的专业性与技术深度。
-
推理卡
-
- 云燧 i10 ==> 一代卡;
- 云燧 i20 ==> 二代卡;
-
训练卡
-
云燧 T10 等于 第一代卡 对应 PCI Express card;
- 云燧 T11 等于 第一代卡 对应 OAM module;
- 云燧 T20 等于 第二代卡 对应 PCI Express card;
- 云ioxieT21 等于 第二代卡 对应 OAM module。

从板级产品角度来看,燧原涵盖了训练与推理场景,并提供了不同规格的训练与推理功能:一代卡云燧 T1x 和 T2x 用于训练卡, 而一代卡云燧 i10 和 i20 用于推理卡. 算力产品线较为完善. 特别之处在于其一代卡上具备 MIG 技术支持(多用户隔离), 而这一技术则是在英伟达直到 A100 才实现.
我对推理卡进行了相关数据的整理工作,并纳入英伟达T4、L4及A10等主流型号作为对比基准

来分析一下
燧原
燧原
燧原
另外值得注意的是,在之前一篇关于天数的文章引起了广泛关注(因此且看且珍惜),因此这篇分析可能会稍显冗长)。对比一些国产算力卡(当然不包括燧原),在描述计算能力时倾向于将矢量计算能力和矩阵计算能力相加(这一做法对于NVIDIA GPU而言则显得有些不同)。以NVIDIA GPU为例,在其官方参数中明确列出了这些指标(而并非将其简单相加)。这样一来(需要注意的一点是):国产卡在宣传时常常将CUDA Core与Tensor Core的数据相加后作为核心卖点进行推广(而这种数值往往会被用来比较不同设备的能力表现)。举个例子(比如介绍某卡的INT8性能时会标榜几百几百TOPS):实际上这是由CUDA Core与Tensor Core数据相加而来(而这样的数值往往被错误地用于声称优于某些特定型号如T4的130TOPS)。相反地T4本身的130TOPS仅指其Tensor Core性能(这一点必须特别提醒大家切勿混淆)。此外还值得指出的是那些包含燧原在内的国产产品由于采用全高全长设计而在对标过程中往往选择性地使用半高半长的T4进行对比(这种级别差异直接导致了明显的产品定位偏差)。
下面是云燧 i20 板卡的产品图,

说完了,继续来说燧原的训练卡。
针对训练卡

从产品形态来看,云燧T21与云燧T20之间存在差异性特征,在算力参数方面具有相同配置。与推理卡云燧i20相仿的是燧原系列的训练卡,在与英伟达高端显卡的对比中同样面临一定的困境表现:一方面其性能略逊于V100;另一方面则明显落后于A100;这种全方位的"性能领先"状态同样伴随着全方位的"差距明显"现象;值得指出的是,在芯片禁令政策下A100依然具备竞争力;因此从这个角度来看其能够超越V100已经可以被视为一种较为积极的结果。
下面是云燧 T20 的产品图,

下面是云燧 T21 的产品图,

详细介绍了这一领域的发展情况和应用前景, 希望能在这一技术方向上为你提供一些参考和启发.
【极智视界】
《极智芯 | 深入解析国产AI算力 聚焦于燃放原产品矩阵》
畅享人工智能的魅力世界,带您体验好玩的人工智能应用。加入我的知识星球吧,在这里您将能够享受到丰富的资源库,汇聚了众多好玩的人工智能项目,所有这些都是以工程源码形式开放使用,涵盖人脸识别、目标检测、图像分割等多种技术领域,还有AIGC生成内容以及自动驾驶方案等实用资源。无论是学习还是实践,这里都能为您提供非常实用的支持与帮助,一定是您探索人工智能领域的好去处,不仅非常有趣,并且会持续推出更多优质内容。

