【IC设计】昇腾910架构学习
昇腾910是华为的AI训练卡,基于7nm EUV工艺,其中有16个基于ARMv8定制的CPU,32个Ascend-Max AI加速器,使用4*6的无缓存NoC Mesh进行互联,使用HBM(High Bandwidth Memory)进行存储,提供128通道的视频译码器。本文内容是参考华为公开资料形成的个人观点,无侵权行为,内容仅供学习!
·
本文内容是参考华为公开资料形成的个人观点,无侵权行为,内容仅供学习!
昇腾910是华为的AI训练卡,基于7nm EUV工艺,其中有16个基于ARMv8定制的CPU,32个Ascend-Max AI加速器,使用4*6的无缓存NoC Mesh进行互联,使用HBM(High Bandwidth Memory)进行存储,提供128通道的视频译码器。
指标:
- 四个HBM总带宽1.2TB/s
- 相邻节点(我的理解是Ascend-Max核)带宽为1024bit*2GHz=256GB/s
- 昇腾910每秒提供256万亿次fp16浮点运算,512万亿次int8运算
- LLC总吞吐量为4TB/s

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐

所有评论(0)