芯东西(ID:aichip001)
编 | 韦世玮
芯(xin)东西2月21日消息(xi),据EE Times报道(dao),EE Times正在对美国、欧(ou)洲和亚洲共约60家AI芯(xin)片(pian)创企进行研究,其(qi)中(zhong)既包括重新设计(ji)可编程逻辑和多核设计(ji)的公(gong)司(si)(si),也(ye)有自研全新体(ti)系架构的公(gong)司(si)(si),以及使(shi)用神经拟态(类脑)和光学计(ji)算等未来技术(shu)的芯(xin)片(pian)公(gong)司(si)(si)等。
随着(zhe)神经(jing)网(wang)络技(ji)术(shu)的不断(duan)发(fa)(fa)展,业(ye)界(jie)对加速AI性能的需求越来越高,世(shi)界(jie)各地亦涌(yong)现出了(le)(le)大(da)量(liang)的AI芯(xin)片创企,持续研(yan)发(fa)(fa)不同的芯(xin)片技(ji)术(shu)。与此(ci)同时,这一行(xing)业(ye)的爆(bao)发(fa)(fa)也吸引了(le)(le)大(da)量(liang)的风险(xian)投(tou)资资金,从而使(shi)行(xing)业(ye)拥有了(le)(le)研(yan)发(fa)(fa)新型计算架构,以及开拓新技(ji)术(shu)方向的资本(ben)。
基于此,EE Times从这来自三大洲的60家AI芯片公司中,选出了最具代表性和发展潜力的十家。根据这些公司产品的定位和应用范围,主要被用在数据中心、终端和AIoT设备这三大领域。以(yi)下内容(rong)基(ji)于(yu)EE Times对这十家芯片创(chuang)企的介绍编译:
一、数据中心:边缘计算应用广泛
若根据(ju)应用范围划(hua)分,数(shu)据(ju)中心也属于边缘(yuan)计算技术的(de)应用领(ling)域(yu)之一。
什么是边缘计算?它主要在和生成或(huo)收集数据相同的位置(或(huo)附近)处理数据,涉及网关或(huo)集线器(qi)设备(bei),以及可加速单个AI应(ying)用程序的本地服务器(qi)。
从应用上看,数(shu)(shu)据(ju)中心的服(fu)务(wu)器还能够(gou)用来(lai)加(jia)速医院(yuan)或医学研究机(ji)构中,X射线或CT扫描(miao)的图像(xiang)分类,或者是从工厂(chang)车(che)间接收状态数(shu)(shu)据(ju)并(bing)进行处理。
1、Graphcore
总部位于英国(guo)布里(li)斯(si)托尔的(de)Graphcore一(yi)(yi)直受到行(xing)业(ye)关(guan)注。在早期一(yi)(yi)轮融(rong)资中,该公司的(de)估值就已超过10亿(yi)美元,成为西方首批(pi)AI芯(xin)片独角兽(shou)之一(yi)(yi)。
性能(neng)(neng)方面,该公司的IPU(智能(neng)(neng)处理单元)芯(xin)片拥有(you)大规模(mo)并行(xing)架(jia)构,具有(you)1200多(duo)个(ge)专用内核(he),每个(ge)内核(he)可运行(xing)6个(ge)程序线(xian)程。
与此同时(shi),它还有(you)大(da)量的(de)片(pian)上存(cun)储(chu)(chu)器、数百兆(zhao)的(de)随机(ji)存(cun)取(qu)存(cun)储(chu)(chu)器(RAM),以及45 TB存(cun)储(chu)(chu)器带宽(kuan),能够让(rang)整个机(ji)器学(xue)习模型存(cun)储(chu)(chu)在芯片(pian)上。
此外,Graphcore的IPU芯片还(hai)可用于戴尔服务器中的边缘(yuan)计算(suan)应用程(cheng)序。

▲Graphcore的IPU芯片(pian)
2、Groq
Groq由(you)谷歌原TPU核心团(tuan)队的8名成员成立,目前(qian)该公(gong)司已拥(yong)有70名员工,并筹集了6700万(wan)美元资金。
去年,Groq曾发布一(yi)款1000 TOPS的(de)芯片架(jia)构,专门(men)针对计算(suan)机视(shi)觉、机器(qi)学习和其他(ta)AI相关工作负载的(de)性能需求(qiu)而(er)设计。同时(shi),它的(de)张量流处理器(qi)(TSP)主(zhu)要(yao)面(mian)向数(shu)据中心应用和自动(dong)驾驶(shi)汽车领域。现阶(jie)段(duan),该器(qi)件已在PCIe板上采样。
除此之(zhi)外,该公司还坚(jian)持“以软件为先”,其(qi)编译(yi)器能(neng)(neng)(neng)处理硬件中的(de)控制功能(neng)(neng)(neng),例如执行计划等。Groq的(de)软件还可精心编排所(suo)有数据流(liu)和所(suo)需时(shi)序,以确保(bao)计算不会出(chu)现停(ting)顿,并在编译(yi)时(shi)完全可预测延迟、性能(neng)(neng)(neng)和功耗(hao)。
3、Cerebras
Cerebras以重振晶圆级芯片计(ji)划(hua)而知名,该计(ji)划(hua)曾在1980年代被(bei)半(ban)导体行业所放弃。
该(gai)公司研发了一块面积(ji)约(yue)为46225平方毫米的巨大(da)芯(xin)片,将40万个内(nei)核(he)与18 GB内(nei)存封装在84个处理器块上(shang),能耗达到15 kW。
虽然(ran)这(zhei)(zhei)些(xie)参(can)数看起(qi)来过(guo)于庞大,但(dan)实(shi)际上(shang),Cerebras研发这(zhei)(zhei)一芯片的(de)目的(de)是用它来替代数千个GPU的(de)工作。
该公司表示,他们(men)已经解决了以(yi)往困扰晶(jing)圆级设(she)计的问题,例如(ru)良率(绕缺(que)陷走线),并研发了可以(yi)抵(di)抗热效应的封装技术。
资金(jin)方面,目前Cerebras已(yi)(yi)经筹(chou)集超过2亿(yi)美元(yuan)的(de)资金(jin)。与此同(tong)时,该公司还透露,他(ta)们的(de)机架系统(tong)已(yi)(yi)在(zai)少(shao)数(shu)(shu)客户(hu)的(de)数(shu)(shu)据中心(xin)里开始(shi)运行。

▲Cerebras的巨型芯片
4、寒武纪
寒武(wu)纪(ji)是中(zhong)国最早的(de)(de)AI芯片创企之一,2016年脱胎于(yu)中(zhong)国科学(xue)院(yuan),由同样(yang)出身于(yu)中(zhong)国科学(xue)院(yuan)的(de)(de)两(liang)兄弟创立(li)。
寒武纪认为(wei),CPU和(he)通用GPU(GPGPU)指(zhi)(zhi)令(ling)集(ji)在加速神经网络方面(mian)缺乏敏捷性,因此他们开(kai)发(fa)了(le)自己(ji)的指(zhi)(zhi)令(ling)集(ji)架(jia)构(ISA)。这是一(yi)种集(ji)成了(le)标量、矢量、矩阵、逻(luo)辑和(he)数据的负载存储架(jia)构,还拥有传输(shu)和(he)控制指(zhi)(zhi)令(ling)。
寒武纪(ji)的第(di)一(yi)个产品Cambricon-1A主要面向智能手机(ji)和其他终端设备,如无人(ren)机(ji)和可穿(chuan)戴(dai)设备。此外,寒武纪(ji)还发布了(le)边缘(yuan)计(ji)算芯(xin)片思元220,性能为8 TOPS、能耗为10 W,进一(yi)步填补该公司在边缘(yuan)计(ji)算产品中的空白(bai)。
目前,寒武纪是全球最有价值的AI芯片创企之一,至今已筹集2亿(yi)美元(yuan)资(zi)金,市场估值达(da)到25亿(yi)美元(yuan)。
二、终端应用:计算机视觉与自动驾驶为主
“终端(duan)”是(shi)指网(wang)络末端(duan)的设(she)备(bei)(bei),其收集和(he)处理数(shu)据都在同一设(she)备(bei)(bei)内部。终端(duan)的产(chan)(chan)品(pin)范围包括安防摄像机(ji)、消费电子(zi)产(chan)(chan)品(pin)和(he)家用电器等,以及自动(dong)驾驶汽(qi)车(che)和(he)智能手机(ji)等某些(xie)可(ke)用作网(wang)关或端(duan)点的设(she)备(bei)(bei)。
1、Hailo
Hailo成(cheng)(cheng)(cheng)立(li)于2017年(nian),由(you)以(yi)色列国(guo)防军精锐情报部门的(de)前任成(cheng)(cheng)(cheng)员在以(yi)色列特拉维夫(fu)成(cheng)(cheng)(cheng)立(li)。目(mu)前,该公司(si)拥有(you)约60名(ming)员工,已筹集了2100万美元(yuan)资金。
据悉,该公司的AI协处理器(qi)Hailo-8性能(neng)为26 TOPS,能(neng)效为2.8 TOPS/W,主要面向ADAS(高(gao)级(ji)驾驶员(yuan)辅助系(xi)统)和自动(dong)驾驶应(ying)用(yong)而设计。
从结构上(shang)看,它混(hun)合了内(nei)存、控制和计算模块,并通(tong)过(guo)软件分(fen)配相邻的(de)模块来计算神经网络的(de)每一层。同时,Hailo-8芯片将于2020年上(shang)半年开(kai)始(shi)实现量产。

▲Hailo的AI协处理器Hailo-8
2、耐能(Kneron)
耐能(neng)成立(li)于(yu)2015年(nian),总部位(wei)于(yu)美(mei)国圣地亚(ya)哥(ge)。目前,该公司在圣地亚(ya)哥(ge)和台湾地区(qu)共(gong)拥有员工(gong)150名,已获(huo)资金7300万美(mei)元。
据(ju)了解,耐能的第一代KL520芯片已被几家公(gong)司宣布使(shi)用,其2019年也实现了数(shu)百万美(mei)元的营收成绩。
性(xing)能方面,KL520芯片还(hai)针对(dui)卷积神经网络(CNN)进行(xing)了优化,在0.5W(相当于(yu)0.6 TOPS/W)下运行(xing)的性(xing)能为0.3 TOPS。同时,它还(hai)能应(ying)用于(yu)IP安防(fang)摄像(xiang)机中的面部识别、智能门(men)(men)锁和门(men)(men)铃。
耐能(neng)表示,他们(men)已开始研发(fa)(fa)用于人脸(lian)识别的(de)神(shen)经(jing)(jing)网(wang)络,并(bing)将它和(he)IP一同(tong)(tong)用来(lai)开发(fa)(fa)神(shen)经(jing)(jing)处(chu)理单元(NPU)。与此同(tong)(tong)时,该公司的(de)第二代芯片将于2020年(nian)夏天(tian)上市,能(neng)够加速CNN和(he)递归神(shen)经(jing)(jing)网(wang)络(RNN)。

▲耐(nai)能的KL720芯(xin)片
3、Mythic
Mythic在2012年密歇根大学成立,如今位于(yu)得克萨斯州奥斯汀市(shi)。现阶段,Mythic已(yi)筹集了8600万美元资(zi)金,将用于(yu)开发模拟计算芯(xin)片。
该芯片基本(ben)采用基于(yu)闪存晶(jing)体管(guan)的内存处(chu)理器(qi)技术,与CPU和(he)GPU相比,Mythic的芯片在功耗、性能(neng)和(he)成本(ben)方面均有优势。
实际上,内存处(chu)理器并(bing)不是什(shen)么新鲜事物。但Mythic表示,他们已经研(yan)发出一种补偿和校准技术,能够消除噪声并(bing)实现(xian)可靠的8位计算。
此(ci)外,Mythic计划出售独(du)立芯(xin)片以及多芯(xin)片处理卡。由(you)于该设(she)备可以处理30 FPS的(de)高(gao)清视频图(tu)像,因此(ci)Mythic的(de)主(zhu)要目标市(shi)场之一是(shi)安(an)防摄像机,以及用于安(an)防摄像机系统的(de)本地聚合器。
值得(de)一提的(de)是,Mythic的(de)CEO Mike Henry在今年的(de)CES 2020上表示,其芯片将很(hen)快进入采样阶段。
4、地平线
地平(ping)线成立(li)于2015年(nian),目前(qian)已经拥有500多名员工,专(zhuan)利超600项。截(jie)止2019年(nian)底,该公司已筹集6亿(yi)(yi)美(mei)元(yuan)资金(jin),市场估值高达30亿(yi)(yi)美(mei)元(yuan)。
地平线的大脑(nao)处理单(dan)元(BPU)最初是为(wei)计算机视(shi)觉(jue)应用而设计,其第(di)二(er)代BPU拥有64位多(duo)指令多(duo)数据(ju)(MIMD)内核,能(neng)处理所有类型(xing)的神经网络(luo),还可通过稀疏神经网络(luo)来(lai)预测(ce)目标的运动(dong)和场景解析。
据了解,地平线的(de)第三代BPU将(jiang)为决策算(suan)法(fa)、深度(du)学习之外的(de)AI提升加速(su)性能。
目前(qian),地平线(xian)拥有两条(tiao)产品(pin)线(xian),分别是面向自(zi)动驾驶领域的征程系(xi)(xi)列,以(yi)及面向AIoT领域的旭日(ri)系(xi)(xi)列。
第(di)一代征(zheng)程和旭日系列处理器(qi)于(yu)2017年12月推出,第(di)二代基于(yu)BPU 2.0的(de)(de)(de)芯(xin)片(pian)(pian)也在(zai)2019年发布。据(ju)称,征(zheng)程2.0芯(xin)片(pian)(pian)在(zai)2 W功率(lv)下能(neng)够提(ti)供(gong)4 TOPS的(de)(de)(de)L3/L4自(zi)动(dong)驾驶(shi)性能(neng),并结合了地平线自(zi)身(shen)的(de)(de)(de)感知(zhi)算法,实现90%的(de)(de)(de)核心利用率(lv)。

▲地平线(xian)的征程处理器
三、物联网:AI推理性能与低功耗需求高
这一(yi)类别(bie)的(de)划分包括具有微控制器(qi)计算(suan)级(ji)别(bie)的(de)芯片,它们能够在资源受限的(de)环境中以超低功耗运行。
在这一情况下,终(zhong)端设备上的AI推理性能(neng)就显得(de)十分重要,因为(wei)它不仅能(neng)降低延迟、节省(sheng)带宽、帮助保护隐私,同时还能(neng)节省(sheng)数(shu)据到云射频(RF)传输过程(cheng)中的能(neng)耗。
1、GreenWaves
GreenWaves成立(li)于2014年(nian),总(zong)部位于法国格勒(le)诺布(bu)尔,是(shi)RISC-V开源生态中最早的芯片供应商之(zhi)一(yi)。
该公司(si)在一个超低(di)功耗机器学习应用处(chu)理(li)器中,使用了多个RISC-V内核,用于电池供电的(de)传感设备。此外,GreenWaves还(hai)依赖其自(zi)定义指(zhi)令(ling)集扩展,以方便DSP操作和实现AI加速的(de)最(zui)低(di)功耗。
GreenWaves的第二(er)代产品GAP9使用(yong)了10个(ge)RISC-V内(nei)核(he)。其中,一个(ge)内(nei)核(he)用(yong)作(zuo)结(jie)构控制器,剩余九个(ge)内(nei)核(he)则组成了计(ji)算机群(qun),控制器和(he)集(ji)群(qun)位于单独的电压(ya)和(he)频域,因此(ci)它们仅在必(bi)要(yao)时才消耗功率。
同时,该芯片还采(cai)用了最先(xian)进(jin)的FD-SOI工艺技术(shu),以进(jin)一步降低(di)功耗。
据(ju)GreenWaves提供的数据(ju),GAP9在160×160幅(fu)图像上运(yun)行预训练模型MobileNet V1时,通道(dao)缩放比(bi)例(li)为0.25,仅(jin)需12ms。
2、Eta Compute
Eta Compute成立于2015年(nian),在美(mei)(mei)国和印度共(gong)拥有35名员工。目(mu)前,该公司已筹集1900万美(mei)(mei)元资金,产(chan)品已进入样品阶段(duan)。
Eta Compute为超低功耗物联(lian)网(wang)设(she)(she)备中的AI处理设(she)(she)计了两(liang)个核心,分别为Arm Cortex-M3微(wei)控(kong)制(zhi)器内核和(he)一个DSP微(wei)处理器。
据了解(jie),这两(liang)个核心(xin)均使用(yong)了Eta Compute的动(dong)态电压和频率缩放技(ji)术,以尽可能低的功率水平运行,而无(wu)需使用(yong)锁相环(PLL)。
其AI工作负载在(zai)(zai)软件的分配下,还可在(zai)(zai)一个(ge)或两个(ge)核心上运(yun)行。同时,该(gai)技术能够以(yi)100µW的功率预算,将(jiang)图像处(chu)理和传感器融合。
此(ci)外,Eta Compute还针对在(zai)ECM3532器件上运(yun)行的超低功耗应(ying)用,对神经网络进行了优化。
文章来源:EE Times