智东西(公众号:zhidxcom)
文 | Lina 心缘

智东西8月1日消息,又一支清华芯片团(tuan)队取(qu)得重(zhong)大突(tu)破!来自清华的“天机”类脑芯片架(jia)构(gou)登上了顶级学术杂志《自然(Nature)》封面。

重磅!清华类脑芯片登上Nature封面,已成立公司,颠覆冯诺伊曼!

28nm的天机(ji)(ji)芯片由156个FCores组成,面(mian)积为3.8×3.8毫米,包含大约40000个神经元和(he)1000万个突(tu)触,可以(yi)同时(shi)支持机(ji)(ji)器学习(xi)算法和(he)类(lei)脑电(dian)路。

据(ju)智(zhi)东西了解,“天机(ji)”类(lei)脑(nao)芯片项目(mu)脱胎于清华精密仪(yi)器系(xi),是清华精密仪(yi)器系(xi)教(jiao)授、脑(nao)计(ji)算中心主任(ren)施路(lu)平教(jiao)授带队(dui)主导的类(lei)脑(nao)芯片项目(mu)之一。

2018年1月,“天(tian)机”团(tuan)队注册(ce)成立了北(bei)京灵(ling)汐(xi)科技(ji),董(dong)事长兼CEO为祝夭龙。灵(ling)汐(xi)科技(ji)于(yu)2018年8月披(pi)露了其天(tian)使(shi)轮融(rong)资(zi),投资(zi)方来自华控(kong)基(ji)石基(ji)金、优选资(zi)本(ben)、清(qing)华控(kong)股。

而本篇Nature论文的第(di)一作者裴京也是灵汐科技(ji)的监事,施路平教授则为公(gong)司董事。

一、脱身清华,落地灵汐科技

重磅!清华类脑芯片登上Nature封面,已成立公司,颠覆冯诺伊曼!

这篇论文名为《面向通用人工(gong)智能的异构融合芯(xin)片架构“天机”(Towards artificial general intelligence with hybrid Tianjic chip architecture)》

这篇论文中(zhong)介绍了(le)(le)清华团队的“天机(ji)”类脑(nao)芯(xin)片架构,它不(bu)(bu)仅算力高、功耗低(di)、支持多种不(bu)(bu)同AI算法、而(er)且采用了(le)(le)存算一体技术(shu),不(bu)(bu)需要外挂(gua)DDR,能够节省成(cheng)本功耗和空间。

在论文(wen)中,研(yan)究团(tuan)队(dui)描述了这种(zhong)芯(xin)片(pian)如何帮助机器响应语音命(ming)令,识别周(zhou)围世界,避(bi)开障碍并(bing)保持平(ping)衡。

而在附(fu)上(shang)的视(shi)频中,“天机(ji)”团队还展示(shi)了搭(da)载该芯片的自(zi)(zi)动驾驶自(zi)(zi)行车是(shi)如何(he)自(zi)(zi)动控(kong)制平衡、并在操场上(shang)对目标人物进行识别(bie)、跟随(sui)、自(zi)(zi)动避障。

论文地址://www.nature.com/articles/s41586-019-1424-8

重磅!清华类脑芯片登上Nature封面,已成立公司,颠覆冯诺伊曼!

▲清华施路平教授

施路平教授表示,此次发(fa)表在《自然》的论(lun)文是(shi)(shi)一个非常初(chu)步(bu)的研究(jiu)(jiu),人(ren)工(gong)通(tong)用(yong)智能是(shi)(shi)一项(xiang)非常具有挑战性的工(gong)作,目前还处于起步(bu)阶段。他和团队的研究(jiu)(jiu)愿景是(shi)(shi)——“发(fa)展类脑计算,支撑人(ren)工(gong)通(tong)用(yong)智能,赋能各行各业”。

据他透露,目前,团队已经启动了下一(yi)代芯片的研究,预期明年年初可以完成研发工作。

未来,天(tian)机芯片有望部署在自动驾驶(shi)汽车和智能(neng)机器(qi)人中。

二、“天机”芯片技术拆解

“天机(ji)”是(shi)一种推进人工通用智能(neng)(AGI)发展的异构(gou)融合(he)芯片架构(gou),结合(he)了神经科学(xue)(xue)导向(xiang)和计算机(ji)科学(xue)(xue)导向(xiang)方法的优(you)点。

在论文中(zhong),作者用一(yi)个无人(ren)自(zi)(zi)(zi)行车系统验证了这一(yi)异构融合芯(xin)片的(de)处(chu)理(li)能(neng)力(li)。试验中(zhong),仅用一(yi)个芯(xin)片,无人(ren)驾驶自(zi)(zi)(zi)行车系统即可同时处(chu)理(li)多种算法(fa)和模型,不仅可以识别语音指令、实(shi)(shi)现自(zi)(zi)(zi)平(ping)衡控(kong)制,还(hai)能(neng)完成(cheng)对前方行人(ren)的(de)实(shi)(shi)时检(jian)测(ce)和跟(gen)踪,并完成(cheng)自(zi)(zi)(zi)动过障(zhang)、避(bi)障(zhang)和平(ping)衡控(kong)制等任务。

据论文(wen)介(jie)绍,发(fa)展人工通用智(zhi)能的方法主要有(you)两(liang)种,一(yi)(yi)种基于计算机科学导(dao)向(xiang),另一(yi)(yi)种基于神经科学导(dao)向(xiang)。

据负责芯片设(she)计和算法(fa)细节的论(lun)文作(zuo)者邓磊介绍(shao),此(ci)前(qian),市面上(shang)的深度学习加速器通常只支(zhi)持计算机科(ke)学模型(xing),神经(jing)形态芯片只支(zhi)持神经(jing)科(ke)学模型(xing)。

两类方法(fa)依赖不同且不兼容的(de)(de)平台,在一(yi)定程度上延缓了人(ren)工通用智能的(de)(de)发展,因此需要一(yi)个可(ke)以支持(chi)通用的(de)(de)基于计算机(ji)科(ke)学的(de)(de)人(ren)工神经(jing)网络(luo)以及神经(jing)科(ke)学启发的(de)(de)模型和算法(fa)的(de)(de)通用平台。

重磅!清华类脑芯片登上Nature封面,已成立公司,颠覆冯诺伊曼!

研究团(tuan)队由此提(ti)出天机(ji)芯(xin)片(pian)(Tianjic chip),同时支持计算机(ji)科学模型(xing)和(he)神(shen)经网络模型(xing)。

邓磊表示,天(tian)机芯片能做到(dao)两(liang)者都支持,同时支持神经科学发(fa)现的(de)众多神经回路网络和异构网络的(de)混(hun)合(he)建模。因为(wei)两(liang)类模型所使用(yong)的(de)语言、计(ji)(ji)算原理、编码方式和应用(yong)场景都不相同,实现这两(liang)种模型深度高效的(de)融(rong)合(he),是天(tian)机芯片设计(ji)(ji)中(zhong)最大的(de)挑战(zhan)。

重磅!清华类脑芯片登上Nature封面,已成立公司,颠覆冯诺伊曼!

天机芯片采(cai)用(yong)多核架构(gou)、可(ke)重(zhong)构(gou)的构(gou)建模块和采(cai)用(yong)混合编(bian)码(ma)(ma)方案的流线型数据流,不仅可(ke)以适(shi)应基于计算机科学的机器学习算法(fa),还可(ke)以轻松实(shi)现脑启(qi)动电路和多种编(bian)码(ma)(ma)方案。

研究团队的一项重(zhong)要创(chuang)新是Tianjic高度可(ke)重(zhong)构(gou)的的统一功能核(FCore),它结合了人工神经网络和(he)生物网络的基(ji)本构(gou)建模(mo)块——轴突、突触(chu)、树突和(he)体细胞(bao)块。

28nm的天机芯片由156个FCores组成,面积为(wei)3.8×3.8毫米,包含(han)大(da)约40000个神经(jing)元(yuan)和1000万个突触,可以同时支(zhi)持机器学习算法和类脑电路。

重磅!清华类脑芯片登上Nature封面,已成立公司,颠覆冯诺伊曼!

天机(ji)芯片(pian)提供超(chao)过每秒610千兆(zhao)字节(GB)的内部(bu)存储器带宽,以及运行(xing)人工神经网络(luo)的1.28 TOPS的峰(feng)值性能。

在生物(wu)启(qi)发的(de)尖(jian)峰神经网络(luo)模式中,天机芯(xin)片实现了(le)(le)每(mei)瓦约(yue)650千兆每(mei)秒突触操作(GSOPS)的(de)峰值性能。该研(yan)究团队还展示了(le)(le)与(yu)GPU相(xiang)比的(de)卓越性能,其(qi)中新芯(xin)片的(de)吞吐量(liang)提高了(le)(le)1.6-100倍,电(dian)源效(xiao)率提高了(le)(le)12-10000倍。

重磅!清华类脑芯片登上Nature封面,已成立公司,颠覆冯诺伊曼!

研究团队设计(ji)了(le)一个(ge)无人驾驶自行(xing)车实验,来评估(gu)芯(xin)片整合(he)多模(mo)态信息和做出迅速决策的能力。

该自(zi)行(xing)车配备天机芯(xin)片和IMU传(chuan)感器、摄像头、转向电(dian)机、驱动电(dian)机、调速(su)电(dian)机、电(dian)池。自(zi)行(xing)车可以执行(xing)实时物(wu)体检测、跟踪、语音命令识(shi)别、骑(qi)行(xing)减速(su)带、避障,平(ping)衡控制和决策等任务。

重磅!清华类脑芯片登上Nature封面,已成立公司,颠覆冯诺伊曼!

研究小组(zu)开发(fa)了各种神经网络(CNN、CANN、SNN和MLP网络)来完成每项任(ren)务。这些模(mo)(mo)型(xing)经过预训练(lian)并编程到(dao)天机芯片上,可以并行处理模(mo)(mo)型(xing),实现不同模(mo)(mo)型(xing)之间的无缝(feng)片上通信。

在实验中,采用天机芯片的无人驾驶(shi)自行车(che)顺利完成了所有分配的任务,这标志着加速AGI发展的巨(ju)大飞跃。

重磅!清华类脑芯片登上Nature封面,已成立公司,颠覆冯诺伊曼!

研(yan)究小组(zu)还指(zhi)出:“通过随机将(jiang)新变量实时引入环境中可(ke)以产生高(gao)时空复(fu)杂性,例如(ru)不同的(de)道(dao)路条件、噪声、天气因(yin)素、多种语(yu)言、更多人等等。通过探索允许(xu)适应这些环境变化的(de)解(jie)决方案(an),可(ke)以检(jian)查(cha)对AGI至关(guan)重(zhong)要(yao)的(de)问(wen)题,比(bi)如(ru)概括、稳健性和自主学习(xi)。”

三、低功耗、低成本、高算力

在去(qu)年10月的安博会上,灵汐科技也向智(zhi)东西展示了其(qi)110nm工艺的第一代、28nm的第二代“天机”架(jia)构的类脑芯(xin)片,主打云(yun)端智(zhi)能市场。

重磅!清华类脑芯片登上Nature封面,已成立公司,颠覆冯诺伊曼!

▲第一、第二代“天机”架(jia)构类(lei)脑(nao)芯片(pian)

灵(ling)汐(xi)科技告诉智东西,由于(yu)绕过了HBM内存技术对AI芯片性能和成本的(de)限(xian)制,灵(ling)汐(xi)科技的(de)芯片与市场同类产品比起来,具(ju)备低功耗、低成本、高计算力的(de)优势。

“天(tian)机”架构(gou)采用优化(hua)过的(de)众核(he)架构(gou),由一(yi)系(xi)列核(he)构(gou)成(cheng)阵(zhen)列完成(cheng)神经网络(luo)的(de)计算。在摩(mo)尔(er)定律即将失效(xiao)的(de)今天(tian),在现有的(de)工艺(yi)基础上,从优化(hua)架构(gou)入手可能(neng)是(shi)提高芯片性能(neng)最重要的(de)手段。

重磅!清华类脑芯片登上Nature封面,已成立公司,颠覆冯诺伊曼!

据灵汐科技介绍(shao),“天机”架(jia)构(gou)(gou)已经超越了传统(tong)的(de)(de)(de)冯诺伊曼结(jie)构(gou)(gou),不(bu)像传统(tong)架(jia)构(gou)(gou)的(de)(de)(de)芯(xin)片(pian)一样在计算的(de)(de)(de)时候必须与DDR进(jin)行大量的(de)(de)(de)数(shu)据交(jiao)互而受存储带宽的(de)(de)(de)限制(zhi),使整个(ge)芯(xin)片(pian)的(de)(de)(de)性能受到影响。

这也是“天机”架构芯片算力(li)高的一(yi)个极(ji)其重要的原因(yin)。因(yin)为不用从外(wai)部导(dao)入数据,因(yin)此它的功耗(hao)比较低(di),也节省了成本和空间(jian)。

结语:类脑芯片,AI计算新蓝海

类(lei)脑(nao)(nao)芯片(pian)其实(shi)并(bing)不是一个新话题了(le)。早在(zai)2014年,IBM就推出(chu)了(le)业内首款类(lei)脑(nao)(nao)芯片(pian)TrueNorth。目前国内外有(you)许多(duo)公司和机构正在(zai)类(lei)脑(nao)(nao)芯片(pian)研(yan)发上投入(ru)大量精(jing)力。

据灵汐科技介绍,与当前市(shi)面上其他(ta)AI芯片架构相(xiang)比,“天(tian)机(ji)”类脑芯片的主要优(you)势有:

1、算力高;

2、功耗低;

3、存算一体,不(bu)需要外挂(gua)DDR,节(jie)省成本(ben)功耗和空间;

4、算法的支持度灵活,既(ji)能高效支(zhi)持人工神经网络(luo)算(suan)(suan)法,又能高效支(zhi)持SNN算(suan)(suan)法;

5、扩展性好,能得到(dao)极大算(suan)力的芯(xin)片阵列,而且(qie)算(suan)力效率(lv)不会(hui)下降(jiang);

6、支持多核重组特性,可以实现多任务并行处理。

就(jiu)在今(jin)年(nian)7月(yue)16日,英特尔也发布(bu)了(le)“Pohoiki Beach”芯片系统,该系统主要(yao)由Loihi神经拟态芯片构成,可处理深度学习任(ren)务(wu),速度比(bi)CPU快1000倍,效率高10000倍,耗电量小100倍。

重磅!清华类脑芯片登上Nature封面,已成立公司,颠覆冯诺伊曼!

Pohoiki Beach系统由64块Loihi芯(xin)片(pian)(pian)的800万个所(suo)谓的神(shen)经元构成。Loihi芯(xin)片(pian)(pian)是英特尔公(gong)司2017年首次推(tui)出的AI芯(xin)片(pian)(pian),是一(yi)款模(mo)仿人类大脑的神(shen)经拟态芯(xin)片(pian)(pian)。

相(xiang)比(bi)于传统(tong)芯(xin)片(pian),类脑(nao)芯(xin)片(pian)的确(que)在功耗(hao)(hao)上具有(you)绝对优势(shi),完(wan)成同(tong)一个任务所消耗(hao)(hao)的能源有(you)时甚(shen)至(zhi)比(bi)传统(tong)芯(xin)片(pian)节省高达1000倍(bei)。

同时类脑(nao)芯片的集成度(du)也(ye)(ye)非常(chang)高,拿浙大推出的“达尔(er)文”芯片来说,其面积为25平(ping)方毫(hao)米,也(ye)(ye)就(jiu)是说边长只有(you)0.5厘米,但内部却(que)能包含(han)500万个晶(jing)体管。

随着行业对(dui)计算(suan)力(li)要求越来(lai)越高,冯氏(shi)瓶颈(jing)将越来(lai)越明显(xian),颠覆传统架构的类脑芯片已为芯片行业开启了(le)一(yi)扇新的大门。


每日一头条

趋势·深度·犀利·干货,最专业的行业解读

深喉爆料、投稿:guoren@k193.net