神经拟态计算机,这是过去几年来智云集团在计算机领域里所获得的巨大成果之一,从人工智能角度来说,其重要性甚至不亚于量子计算机。
因为神经拟态计算机是一种模仿生物大脑的电子计算机,尽管其底层核心依旧是电子半导体,但是芯片结构以及计算模式都不一样。
具体体现到人工智能领域里,就是其低精度计算能力非常强悍,并且拥有极低功耗,在逻辑推理领域拥有非常优秀的应用表现。
当然,单纯依靠神经拟态计算机也是没啥用处的……至少以目前的技术水平而言,是很难让神经拟态计算机单独工作,并发挥巨大的作用。
这个有点类似量子计算机,目前智云集团的量子计算机,哪怕是最新型号的第六代量子计算机YCL-61,依旧无法独立工作完成所有类型的计算任务,它依旧需要搭配电子计算机来协同运算。
这就是智云集团之前自用的‘第二代综合算力系统’,目前也外销的是‘智云量子综合算力系统’。
智云集团所研发的第六代神经拟态计算机,也有着类似的特征,光靠它自己虽然也可以勉强执行大量任务,但是效率很一般,真正搞起来还没有传统的电子计算机效率高。
但是如果把它和电子计算机结合起来,那么又不一样了。
电子计算机可以专注于高精度计算任务,神经拟态计算机则是可以专注于低精度运算,两者相互进行配合,然后起到一加一大于二的效果。
而智云集团在之前,则是把神经拟态计算机,融合到了第二代综合算力系统当中,也就是把神经拟态计算机和超导量子计算机,电子计算机有效结合起来,最终形成了第三代综合算力系统。
即‘YANC’系统。
智云集团的综合算力系统的发展脉络,其实非常清晰的。
第一代就是以GPU为核心,配属CPU,内存,闪存这些东西,重点在提升GPU之间的通信带宽,这是属于纯电子计算机算力系统。
第二代,则是超导量子计算机和电子计算机的有效结合。
第三代,则是超导量子计算机以及电子计算机,再加上神经拟态计算机的综合应用。
由此可见,神经拟态计算机在智云集团的人工智能技术发展里是具有重要的作用的,是用来研发,训练下一代人工智能模型的底层技术以及硬件支持。
而现在,智云集团则是想要把这种神经拟态计算机进一步扩充其应用,不仅仅是局限在服务器里,而是尝试把它移植到各类终端设备里,在终端为人工智能模型提供更高效,更低功耗的低精度算力。
基于神经拟态计算机的重要性,徐申学知道了工程师们的计划后,也亲自来到了神经拟态计算机项目组的研发大楼,听取他们的介绍以及意见。
F栋大楼里,神经拟态计算机项目组,项目执行总裁姚宏文为徐申学介绍了他们近期的一些项目成果:
“自从我们研发出来了第六代神经拟态计算机后,我们项目组继续在神经拟态计算机领域里进行深入研究,尤其是神经拟态芯片的研发!”
“同时这也是考虑到了神经拟态芯片的性能,也直接受到了逻辑芯片制造工艺水准的影响,毕竟我们的神经拟态芯片,是采用逻辑芯片制造工艺所制造的,第六代芯片采用的是N5工艺!”
“而这一工艺,已经有些落后了,所以去年开始,我们就已经根据N3工艺研发新一代,即第七代神经拟态芯片!”
“新的第七代芯片,采用N3工艺制造,目前已经流片成功!”
“第七代芯片,采取了我们全新设计的新一代智脑7构架,该构架拥有1024个神经元处理核心,核心数量比上一代的智脑6构架翻了一倍。”
“每个核心拥有六万五千个神经元,对比上一代的四万个神经元也增加了两万五千个!”
“如此,我们的单枚智脑7芯片,拥有六千六百五十六万个神经元,对比上一代芯片的两千零四十八万个神经元,提升了三点二五倍!”
“神经元数量的大幅度提升,则是让智脑7芯片的综合性能也获得了大幅度的提升!”
“但是芯片面积只增加了百分之二十五,功耗只增加了百分之十。”
“相对芯片面积增加带来的些许制造成本的提升,相对于芯片功耗的百分之十的提升,其性能的巨额提升拥有巨大的战略意义!”
“它能够让我们的新一代神经拟态计算机系统,拥有更强悍的低精度计算能力,这对YANC系统的整合性能提升,是有巨大价值的!”
“为了更好的发挥出智脑7芯片的强悍性能,也考虑到了芯片面积提升带来的封装难度,还有功耗提升带来的散热设计问题,我们采取了小规模封装模式,以百枚芯片为封装标准,最后集成封装了为这种智脑7大芯片!”
“封装后的这种智脑7大芯片,可以提供六十六亿五千六百万个神经元!”
这种智脑7大芯片密集封装后,体积和智脑6芯片的那种超大盘子一样,看起来就很夸张。
之所以搞这种夸张的大封装,理由很简单,就是为了提升智脑芯片之间的数据传输速度……毕竟再怎么折腾,都不如直接把它们封装在一起。
其原理,有点类似APO显卡和GPU核心和HBM封装在一起,以提升数据带宽一样。
而到了智云集团的智脑芯片,则是直接把智脑芯片给封装在一起,并且为了尽可能的获得更大的数据传输速度,其疯狂规模很夸张,直接把百枚芯片给封装在一起了……为此,智云微电子那边甚至都专门研究了一种大面积封装技术。
搞人工智能训练以及运营,数据传输速度是一个非常关键的性能数据……APO显卡的性能之所以能够吊打AMD的显卡,就是因为它采用了独家的数据传输构架,其数据带宽极高。
不仅仅是单卡的数据带宽高,而且搭配专门的GT服务器构架后,服务器之间的数据带宽也非常高。
毕竟训练人工智能嘛,需要处理的是海量的数据,这传输数据的通道是否顺畅,直接影响了训练效率,如果数据带宽不行,那么GPU核心的性能再牛逼也没用。
用俗话来说就是:巧妇难为无米之炊!
而到了智云集团研发的神经拟态芯片以及相搭配的计算构架,也是类似的原理,当然,只是原理类似,实际技术路线差异很大,这一套技术框架真展开了说,可以写几千页的技术说明文档,很复杂的。
徐申学现在所看到的智脑7大芯片,就是这种封装好后的大芯片,面积比较大,单独安装在一个服务器的主板上,然后搭配其他各类零配件以及供电,散热,数据交换等诸多系统,最后组成了单个智脑7算力单元。
姚宏文继续道:“我们智脑7服务器,以八个智脑7算力单元为一组,构成一个立式智脑7服务机柜,整个服务器可以提供五百三十二亿四千八百万个神经元!”
“只需要两台服务器,就能提供一千零六十四亿个神经元,而这已经超过了人类大脑主流八百五十亿个神经元了!”
“新一代的智脑7神经拟态计算机系统,其综合性能对比上一代的智脑6神经拟态计算机系统,硬件性能提升了二点五倍,而实际应用于人工智能训练的时候,其综合算力提升更多,部分计算任务下,性能提升能够达到十五倍左右,部分常规任务的提升也能够达到五倍到十倍之间。”
“硬件性能的提升,带来的综合算力提升是巨大!”
“性能大幅度提升的同时,功耗只提升了百分之十五左右,这意味着每单位的算力功耗成本也大幅度降低了!”
徐申学一边听,一边看着眼前的这个智脑7神经拟态计算机系统,从小如指甲片的智脑7芯片,再到如同大盘子一样的智脑7大芯片,然后是单个的智脑7计算单元,再到整合起来的大型机柜。
这东西从视觉效果去看,其实也没什么,反正没有超导量子计算机的内部结构那么让人震撼。
咋一看,其实这个智脑7服务器,和普通的电子计算机服务器并没有太大的差异。
但是徐申学确实知道,这内部区别可大了去。
“智脑7既然搞出来了,那么后续也不要耽误了,该量产就量产,该用就用,YANC系统那边等着用了呢!”
YANC系统是一个综合性的算力系统,其内部的算力单元组成是可以升级的。
之前的超导量子计算机,就从YCL-51升级到了现在的YCL-61。