终于找到一款性能超过英特尔的国产AI视觉芯片
编者按:
为了弄清楚“名义算力” 和 “芯片实际利用率” 之间的差异,记者非常好奇的将一颗在计算机视觉领域长期处于翘楚的Intel Movidius Myriad X 芯片,与《人民日报》提到的肇观电子N161进行了比较。
之所以把这两颗芯片进行比较,是因为我们熟悉Intel。无论在任何品牌的PC机,还是笔记本,或者是平板电脑上,都能够看到无处不在的 “Intel 某款芯片 inside” 标签。而我们知道,英特尔的威力根本不仅限于此,在数据中心、工业制造等各个方面所占据的霸主地位,也如同它为PC、笔记本、平板电脑提供芯片的地位一样,无可撼动。
2016年,Intel芯片设计将触角伸到了计算机视觉领域,收购了计算机视觉公司Movidius。 Movidius Myriad VPU 是Intel第一个用于深度神经网络推理的视觉处理单元芯片。 Intel的这项收购也可想而知的,在计算机视觉领域,移植了它在其他领域的霸主惯性思维。
▲ Movidius Myriad X 芯片
▲肇观电子N1系列芯片
在计算机视觉领域,让机器像人一样去分析图片,不管是把图片上的内容进行分类(分辨出人、车、房、树), 还是将图片内容进行检测(检测出男人、女人、老人、孩子,以及他们所处于图片中的位置),或者是将一张图片的不同内容进行分割(人脸上哪里是眼睛、哪里是口罩),等等,都需要用高性能的芯片将不同的算法部署到实际的应用上。
▲检测到图中的狗、猫、兔子
针对于实现图片分类、检测、分割等功能的算法,每个算法公司会根据自己的需求研发出不同的算法,衡量一颗计算机视觉芯片的AI性能是否优秀,需要看它在跑不同算法的时候,是否能够在单位算力下运行更多帧图片,并且还要保证算法精度不损失。
▲在保证FP16精度的情况下,针对6种算法,
N161和Myriad X芯片每秒可计算的图片数量
记者邀请了算法工程师随意挑选了几种常用的图片分类算法和图片检测算法,让两颗芯片同时跑这些算法,惊讶的发现了两颗芯片在单位算力下,每秒能跑的帧率所呈现出的不同的结果。ResNet-50、Inception V3、MobileNetV1、MobileNetV2 是常见的用于图片分类的神经网络算法,MobileNetV1_SSD、YOLOV3 是常见的用于图片检测的神经网络算法。以MobileNetV1算法为例,为了达到图片分类的目的,算法工程师用肇观电子N161芯片跑算法,每单位算力/每秒可以跑181.49帧,用英特尔Myriad X芯片来跑同样的算法,每单位算力/每秒只能跑106.15帧。
单位算力下跑得快有什么现实的意义?
▲根据货物的大小、形态、颜色,自动分拣
在一个用于货品分类的智能工业相机场景,传送带上面的货物需要被连续拍摄、检测和分类,传送带的传送速度要和智能相机的计算能力相匹配,如果传送带传得快但是相机计算不过来,就会导致整个自动控制系统的失效;智能相机计算得越快,传送带就可以传送的越快,产线吞吐率就能得到相应的提升,生产效率就能提升。
▲靠人眼看回放进行监控
在智能安防领域,建设城市视频监控系统是实现城市安全和稳定的重要基础,是“平安城市”建设的重要组成部分,更成为“智慧城市”的重要载体。传统的安防监控只能达到“看得见”的功能,公安机关需要靠人眼追溯录下的视频来破案,而肇观的芯片应用到智能安防领域,能够让摄像头“看得清”,“看得懂”,极大提高破案效率,甚至将案件防范于未然,把大量重复简单的工作留给机器去解决。
每个应用和系统厂商都在寻找在性能、功耗、成本等方面综合因素下合用的AI芯片。 AI芯片是否适合使用,往往从每元钱能获得的性能、每度电能获得的性能、部署实施的成本、元器件是否稳定可靠等几个方面来衡量。 据悉,肇观电子的N161芯片得到的某些客户反馈称: 用1T的算力部署的系统的性能达到了其他厂商宣称的4~5T的水平。 这充分说明了芯片实际利用率是检验芯片AI性能的金标准。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第2509期内容,欢迎关注。
推荐阅读
半导体行业观察
『 半导体第一垂直媒体 』
实时 专业 原创 深度
识别二维码 ,回复下方关键词,阅读更多
存储|晶圆 |华为 |FPGA|苹果|OLED|射频|封测
回复
投稿
,看《如何成为“半导体行业观察”的一员 》
回复 搜索 ,还能轻松找到其他你感兴趣的文章!
- 半导体行业观察
- 摩尔芯闻