此前提到过,早在08奥运期间,洛老板到京城出差时,便找到了寒武纪的两位创始人,陈韵霁和陈天实,并将二人纳入到了极光的芯片联合研发项目组。
当时,两人还在中科院计算所工作。
等到了13年,北极星又联合中科院计算所、国投创业,扶持二人成立了寒武纪。
去年,哥俩儿便在极光的资源扶持下,正式完成了全球首颗“深度学习处理器”原型芯片,“寒武纪1号”的流片。
今年年初又乘胜追击,研发出了全球首款商用终端AI处理IP,寒武纪1A!
也就是前世麒麟970,集成的那一款。
洛川手中的这份文件,正是“寒武纪1A”的测试报告!
其采用了中芯国际28nm工艺,主频1GHz,峰值性能5.12TFlops。
支持稀疏化神经网络优化,等效峰值达20TFlops!
整体而言,性能符合团队预期。
而在星光的规划中,寒武纪1A,将作为核心AI处理单元,集成到“昆仑400A”的芯片架构之中。
极光和星光联合研发的NPU单元,则将集成于,极光O2搭载的“昆仑400B”之中。
至于说,为何要搞得这么麻烦。
一方面,自然是为了扶持寒武纪。
作为一家初创企业,最缺的就是稳定的订单造血,以及大规模的实际场景验证。
而星光系列的销量,往谦虚了说,至少也是5000万台打底~
这一笔订单,就足够寒武纪吃到满嘴流油了~
同时,数以千万计的星光手机用户,日常使用中,产生的AI场景数据,也可以帮助寒武纪,快速发现寒武纪1A的性能短板,进而优化迭代。
此外,作为星光的旗舰机型,星光X7也可以起到很好的示范作用,将寒武纪推进行业主流视野之中。
另一方面,星光也需要确保,自家的高端产品线,相较于竞品,有着更强的竞争力。
虽说,寒武纪1A,与昆仑芯片底层架构,进行了深度整合,在拍照、语音等基础AI场景下表现够用。
但毕竟是要对外销售的产品,必然要兼顾“通用性”,以适配不同厂商的芯片架构、系统接口、软件框架。
比如,为了兼容其他厂商的系统,寒武纪1A需预留部分算力。
这将导致,其在星光专属场景下,算力利用率,仅能达到70%~80%,无法完全释放昆仑芯片的AI潜力。
这也是第三方芯片厂商的通病。
如高通、联发科、三星、英伟达等等,皆是如此。
而极光和星光自研的NPU,则完全不用考虑这些。
所有算力,皆针对极光O2的核心场景优化。
比如,针对极光O2主打的“AI影像大师”功能,自研NPU,可以直接与摄像头传感器、图像处理算法深度绑定,实时识别100+拍摄场景!
还能联动星轨GPU,实现“AI动态光影渲染”。
拍出来的照片质感,较之用寒武纪1A的机型,高出一个档次。
又比如,自研NPU,可以深度适配“小悠”。
针对中文语境下的方言识别、模糊语义理解,进行专属优化。
识别准确率,比通用版的寒武纪1A,预计将高出25%以上!
还有更深层次的多任务AI协同处理能力、端侧隐私计算优化等等。
这种“专属优化”,以及对于“极致体验”的追求,所带来的体验差距,是通用芯片永远也无法满足的。
总而言之,这套“寒武纪+自研”的双NPU布局,还是很有必要的。
通过寒武纪,卡位行业生态,构建国产AI芯片生态。
再依靠自研NPU,构筑无法被复制的体验护城河。
双赢~
接下来,就等中芯国际那边的好消息了~