深度学习论文: MCUNet: Tiny Deep Learning on IoT Devices及其PyTorch实现
发布时间
阅读量:
阅读量
深度学习论文: MCUNet: Miniature Deep Learning on IoT Devices及其PyTorch实现
论文标题: MCUNet: Miniature Deep Learning on IoT Devices
下载地址: https://arxiv.org/pdf/2007.10319.pdf
PyTorch实现: https://github.com/shanglianlm0525/CvPytorch
详细代码资源: https://github.com/shanglianlm0525/PyTorch-Networks
1 概述
MCUNet是一种专为物联网(IoT)设备设计的模型方案,在此基础上通过整合优化NAS和Engine来构建高效的计算架构。该方案实现了该模型在低功耗嵌入式处理器上的高效运行,并且具备较高的计算精度。

2 MCUNet
相比于传统方案,MCUNet联合设计方案可以更好的利用微处理器的资源。

2-1 TinyNAS: Two-Stage NAS for Tiny Memory
TinyNAS采用了两阶段的网络架构设计,在第一个阶段优化搜索空间以满足资源限制,在第二个阶段执行网络架构搜索。该系统能够在较低的计算开销下灵活应对各种约束条件(如设备性能、数据传输延迟、能源消耗和内存容量等)。

2-2 TinyEngine: Memory-Efficient Inference Library
TinyEngine是一种内存效率极高的推理引擎。其采用整体网络架构并结合内存优化机制,在不依赖传统层状结构的前提下实现了显著的性能提升。该引擎能够将内存占用降低至原来的2.7倍,并通过智能算法进一步提高了处理速度,在实际应用中可实现1.7至3.3倍的速度提升(相较于当前主流框架的表现)。

3 Experimental

全部评论 (0)
还没有任何评论哟~
