On-Device 执行,即整图卸载执行,充分发挥异腾芯片的算力,可以大大降低交On-Device 执行,即整图卸载执行,充分发挥异腾芯片的算力,可以大大降低交互的开销,从而提升加速器占用率,关于 0n-Device 执行以下描述错误的是()
B.超强芯片算力下模型执行的挑战: 内存墙问题、交互开销大、数据供给难。部分在 Host 执行,部分在 Device 执行, 交互开销甚至远大于执行开销,导致加速器占用率低
C.MindSpore 通过面向芯片的深度图优化技术,同步等待少,最大化数据计算通 信的并行度,训练性能相比 Host 侧图调度方式持平
D.超强芯片算力下分布式梯度聚合的挑战:ReslNet50 单迭代 20ms 时间时会产生中 心控制的同步开销和频繁同步的通信开销。传统方法需要 3 次同步完成 A11 Reduce, 数据驱动方法自主 A11 Reduce, 无控制开销