智东西(公众号:zhidxcom)
文 | Lina

导语:最近半年以来,人工智能的发展重心逐渐从“软”到“硬”,相伴而生的是全新一代AI芯片产业的全面崛起。智东西历经数月,首次对AI芯片全产业链上下近百间核心企业进行报道,覆盖国内外各大巨头玩家、新兴创企、场景应用、代工生产等,全面深入地对芯片产业发展、创新创业进行了追踪报道。此为智东西AI芯片产业系列报道之一。

在机器学习算法(fa)不(bu)(bu)断变(bian)化(hua)、人工(gong)智能(neng)应用不(bu)(bu)断增多的(de)当下,神经网络计算芯片(pian)(AI芯片(pian))的(de)设计者们所思(si)考的(de)一(yi)个关键问(wen)题开始浮出(chu)水(shui)面——如何在保证AI芯片(pian)性能(neng)/功耗表(biao)现优秀的(de)同时(shi),尽可能(neng)的(de)在更(geng)多人工(gong)智能(neng)算法(fa)上通用。

目(mu)前市面(mian)上(shang)陆(lu)续涌现(xian)的(de)AI芯(xin)(xin)片(pian)中,有不少都采用了重新设(she)计芯(xin)(xin)片(pian)底层(ceng)架构(gou)的(de)方式,来平衡AI芯(xin)(xin)片(pian)的(de)性(xing)能与AI算(suan)法通(tong)用性(xing)之间(jian)“鱼与熊掌不可兼(jian)得(de)”的(de)矛盾,突出玩家有寒武纪、谷歌TPU项目(mu)等等。

AI芯片终极难题 被清华大学IC男神解决了!

产业界(jie)如此(ci)热(re)火产天的发展,离不开学术(shu)界(jie)此(ci)前的长久积累。在过(guo)去的十几(ji)年里,清(qing)华微(wei)电(dian)子所的可重构(gou)计算团队一(yi)(yi)直在研(yan)究(jiu)一(yi)(yi)项核心技术(shu)——“软(ruan)件(jian)定(ding)义(yi)芯片”,前年,他们推出(chu)了一(yi)(yi)款代号为Thinker 1的AI芯片,这款芯片不仅能够支持(chi)人脸识(shi)别(bie)、语(yu)音识(shi)别(bie)的AI算法,而且芯片的功耗非(fei)常(chang)小——只(zhi)需要7号AA电(dian)池就够让它运行一(yi)(yi)整年。

在2018年(nian)的春节前夕(xi),智东西(xi)专门来到清(qing)华大(da)学校园里,与GTIC 2018重(zhong)磅嘉宾(bin)之一,清(qing)华大(da)学微(wei)电子(zi)研究所所长、中国(guo)半(ban)导(dao)体(ti)(ti)行(xing)业协会(hui)IC设计分(fen)会(hui)理事长、我(wo)国(guo)半(ban)导(dao)体(ti)(ti)行(xing)业“男神(shen)”级(ji)人物(wu)魏少(shao)军(jun)教授(shou)围绕着(zhe)AI芯片(pian)的话(hua)题展开了独家(jia)对(dui)话(hua)。魏少(shao)军(jun)教授(shou)有着(zhe)数(shu)十(shi)年(nian)半(ban)导(dao)体(ti)(ti)行(xing)业经验,对(dui)我(wo)国(guo)半(ban)导(dao)体(ti)(ti)产业有着(zhe)深刻的认识(shi),看(kan)法往(wang)(wang)往(wang)(wang)一针见血(xue)。

AI芯片终极难题 被清华大学IC男神解决了!

他(ta)认为,目(mu)前(qian)芯(xin)片(pian)架(jia)构创新已(yi)经(jing)引(yin)起了全球各个学院(yuan)/企(qi)业(ye)的(de)广泛关(guan)注,尤(you)其(qi)是(shi)“软(ruan)件(jian)定(ding)义芯(xin)片(pian)”相关(guan)研(yan)究,更是(shi)提升AI芯(xin)片(pian)的(de)应用范畴、适应AI算法不(bu)断变化(hua)的(de)重要(yao)研(yan)究方(fang)向(xiang)。在今(jin)明两年之内AI芯(xin)片(pian)将持(chi)续火热,但是(shi)到了2020年前(qian)后则会行业(ye)洗牌,出(chu)现第一批出(chu)局(ju)者。

一、性能 vs 灵活:鱼与熊掌不可兼得

芯片的性能(neng)(neng)(neng)跟通用性常常是一(yi)(yi)个(ge)“鱼和熊掌(zhang)不(bu)(bu)可兼得”的选(xuan)项,传统架构下,一(yi)(yi)个(ge)芯片在(zai)某些特定(ding)领(ling)域的性能(neng)(neng)(neng)越(yue)强、功耗(hao)越(yue)低,它往往就(jiu)越(yue)不(bu)(bu)灵活、越(yue)不(bu)(bu)通用。举个(ge)例子(zi),华(hua)为Mate 10里的麒麟(lin)970芯片用于手机的性能(neng)(neng)(neng)非常强大,但(dan)是它并(bing)不(bu)(bu)适用于安防摄像头、可穿戴手环(huan)等(deng)场景;同(tong)理,一(yi)(yi)个(ge)CPU能(neng)(neng)(neng)够灵活地处理众多不(bu)(bu)同(tong)任(ren)务(wu),但(dan)是它在(zai)某些特定(ding)任(ren)务(wu)上往往性能(neng)(neng)(neng)不(bu)(bu)够强大,比(bi)如(ru)在(zai)深(shen)度(du)神经网(wang)络训练(lian)上的性能(neng)(neng)(neng)不(bu)(bu)如(ru)GPU。

而ASIC这类专(zhuan)用(yong)芯(xin)(xin)(xin)(xin)片的(de)位(wei)置,则介(jie)乎于手机SoC这类标准芯(xin)(xin)(xin)(xin)片、与CPU这类通(tong)用(yong)芯(xin)(xin)(xin)(xin)片之(zhi)间——这是一(yi)(yi)个(ge)非常(chang)尴尬的(de)地位(wei),标准芯(xin)(xin)(xin)(xin)片虽然单(dan)个(ge)开(kai)发成本高,但是单(dan)一(yi)(yi)品(pin)类出货量(liang)非常(chang)大(da)(da),很(hen)大(da)(da)程度上降(jiang)低了芯(xin)(xin)(xin)(xin)片的(de)单(dan)个(ge)价(jia)格;而通(tong)用(yong)芯(xin)(xin)(xin)(xin)片则相反,虽然总体出货量(liang)不(bu)高,但是单(dan)一(yi)(yi)品(pin)类的(de)价(jia)格很(hen)高,也能(neng)够分摊研发成本。

随(sui)着芯片制造工艺的日益先进(jin)(目前已经(jing)逼近7nm),芯片制造成(cheng)本也水(shui)涨船高(gao)(gao),如今设计(ji)制造一颗(ke)10nm芯片的成(cheng)本要(yao)几千万美元,综合成(cheng)本高(gao)(gao)达(da)上(shang)亿美元。

因此(ci),如果不能保(bao)证某(mou)款单一(yi)应用(yong)场景下能够(gou)大量出货(huo),专用(yong)芯(xin)片需要(yao)保(bao)持一(yi)定的通(tong)用(yong)性与灵活度(du)。

最近两年(nian)间,产业界开始陆续涌现出(chu)神经网络计算专用芯片(pian)(pian)(pian)(AI芯片(pian)(pian)(pian)),寒武纪、深鉴科技、中(zhong)星微电子等玩(wan)家的AI芯片(pian)(pian)(pian)产品采用的都是28nm的芯片(pian)(pian)(pian)工艺,前(qian)期(qi)从投入到流片(pian)(pian)(pian)的成本(ben)超过400万美(mei)元,单一品类(lei)出(chu)货量没(mei)有百万的级别将很难收回(hui)成本(ben)。

而(er)除(chu)了成本之外,AI算法(fa)(fa)的(de)演进也需要纳入考虑(lv)。由于目前人工智(zhi)能(neng)算法(fa)(fa)还(hai)在不断变化、不断演进的(de)过程中,人工智(zhi)能(neng)经(jing)历了六十多(duo)年(nian)的(de)发展才迎来了深度学(xue)习(xi)的(de)大规模爆发,然(ran)而(er)现在深度学(xue)习(xi)算法(fa)(fa)还(hai)有众多(duo)有待优化的(de)方(fang)面,比如稀疏(shu)化、低(di)功耗(hao)、小(xiao)数(shu)据训练等,算法(fa)(fa)尚未定型(xing)。

此外,目前(qian)语(yu)音(yin)/文(wen)字/图像/视频(pin)等不同(tong)应(ying)用无法(fa)使用统一(yi)算法(fa),然而许多实际生活中(zhong)的(de)AI应(ying)用程序(识别图像中(zhong)的(de)对象或理解人类语(yu)言(yan))需要不同(tong)类型的(de)具有不同(tong)层(ceng)数的(de)神经网络的(de)组合。

因(yin)此,在确保(bao)AI应用性能的前提下,AI芯片需要尽可能地保(bao)持芯片通(tong)用性。

目前AI芯(xin)(xin)(xin)片(pian)(pian)企(qi)业们采(cai)用(yong)(yong)(yong)的(de)技术方(fang)案各不相(xiang)同(tong),如(ru)果(guo)将芯(xin)(xin)(xin)片(pian)(pian)通用(yong)(yong)(yong)性作(zuo)为评测坐标轴,最(zui)左边(bian)、最(zui)激进的(de)企(qi)业会采(cai)用(yong)(yong)(yong)算法固化方(fang)案,这一(yi)做(zuo)法成本低、芯(xin)(xin)(xin)片(pian)(pian)落(luo)地(di)时(shi)间短、单一(yi)算法的(de)性能(neng)与功耗(hao)比能(neng)够(gou)做(zuo)到(dao)极致,但是极大减(jian)少了芯(xin)(xin)(xin)片(pian)(pian)的(de)通用(yong)(yong)(yong)型和灵活性;最(zui)右边(bian)的(de)团(tuan)队(比如(ru)寒(han)武纪、谷歌TPU等)则会设计(ji)一(yi)款全新的(de)芯(xin)(xin)(xin)片(pian)(pian)架构,这一(yi)做(zuo)法成本高(gao)昂(ang)、芯(xin)(xin)(xin)片(pian)(pian)研(yan)发周(zhou)期(qi)长,但是能(neng)够(gou)在性能(neng)与芯(xin)(xin)(xin)片(pian)(pian)通用(yong)(yong)(yong)性上达到(dao)极好(hao)的(de)平衡。

AI芯片终极难题 被清华大学IC男神解决了!

▲清华微电子(zi)所所长魏少军(jun)教授(shou)

清华微(wei)电子所的可重(zhong)构计(ji)算团(tuan)队就属于坐标轴(zhou)右边的一类,从2006年开始,清华微(wei)电子所所长魏少(shao)军教授就带领着团(tuan)队在持(chi)续深入研究这项重(zhong)要技术(shu)——“软件定义芯片(pian)”,又称“可重(zhong)构计(ji)算技术(shu)”。

“软(ruan)件(jian)定义芯(xin)片”顾(gu)名(ming)思义就是(shi)(shi)让芯(xin)片根(gen)据(ju)软(ruan)件(jian)进行适(shi)应与调(diao)整,这是(shi)(shi)一项(xiang)专用芯(xin)片架构(gou)设计上(shang)的(de)创新,与传统的(de)冯诺依曼架构(gou)有着很大的(de)区别(bie)。简单来说就是(shi)(shi)将软(ruan)件(jian)通(tong)过(guo)不同(tong)的(de)管道输送到硬件(jian)中来执行功能,使得芯(xin)片能够实时(shi)地(di)根(gen)据(ju)软(ruan)件(jian)/产(chan)品的(de)需(xu)求改变功能,实现(xian)更加灵(ling)活的(de)芯(xin)片设计。

也就是(shi)说(shuo),沿用(yong)这种(zhong)架(jia)构(gou)设(she)计(ji)出来(lai)的(de)专用(yong)芯片(pian),可以让芯片(pian)的(de)计(ji)算(suan)能力(li)按照软件(jian)的(de)需求(qiu)来(lai)调整适(shi)应(ying)(ying),而(er)不是(shi)沿用(yong)传统芯片(pian)设(she)计(ji)的(de)刚性架(jia)构(gou),让应(ying)(ying)用(yong)适(shi)应(ying)(ying)架(jia)构(gou)。对于现在(zai)尚未定(ding)型/统一的(de)各类AI算(suan)法而(er)言,可重构(gou)计(ji)算(suan)成了AI芯片(pian)设(she)计(ji)的(de)一个重要研究方向。

二、Thinker AI芯片:语音图像双识别、一节电池用一年

前年(2016年),依照可重(zhong)构计算(suan)芯(xin)片的(de)框架,魏少军教授团队中的(de)尹首(shou)一副(fu)教授带队设计研发了一款代号为Thinker 1的(de)可重(zhong)构混合(he)神经(jing)网(wang)络计算(suan)芯(xin)片。

这款芯(xin)片不(bu)仅可以动(dong)态(tai)地调整(zheng)计算和内存(cun)需求,使得芯(xin)片能(neng)够(gou)支持人脸(lian)识(shi)别和语音识(shi)别的神经网(wang)络应用,而(er)且芯(xin)片的功耗非常小——只需要八节7号(hao)AA电池就够(gou)让它(ta)运行一整(zheng)年(nian)。

AI芯片终极难题 被清华大学IC男神解决了!

Thinker 1不(bu)仅在AI性(xing)能与算(suan)法通用性(xing)上取得了(le)突(tu)破性(xing)的进(jin)展,还(hai)获(huo)得了(le)学(xue)术界的重(zhong)要认可(ke),在2017 ACM/IEEE ISLPED国(guo)际低功耗电子学(xue)与设计会议上,Thinker1获(huo)得了(le)设计竞(jing)赛(sai)奖,这是中国(guo)大陆单位首(shou)次以第(di)一完成单位获(huo)得此(ci)奖项。

魏少(shao)军教授告诉(su)智(zhi)东西,Thinker 1是一(yi)块实验性质的(de)(de)(de)验证芯(xin)片(pian)(pian),为(wei)了证明(ming)“软件定义(yi)芯(xin)片(pian)(pian)”这一(yi)架构在AI芯(xin)片(pian)(pian)设计(ji)中的(de)(de)(de)可行性——效果出奇(qi)的(de)(de)(de)好(hao)。随(sui)后,可重构计(ji)算团(tuan)队(dui)又(you)打造(zao)了两款(kuan)Thinker系列芯(xin)片(pian)(pian),分(fen)别(bie)为(wei)Thinker 2人脸识别(bie)芯(xin)片(pian)(pian),能(neng)够做到6ms人脸识别(bie)(iPhone X为(wei)10ms)、准确率超过98%;以及(ji)Thinker S语音识别(bie)芯(xin)片(pian)(pian),不仅功耗(hao)只(zhi)有200多微(wei)瓦,只(zhi)需要一(yi)节7号AA电池就运行一(yi)整年,而且可以进行声纹识别(bie)。

AI芯片终极难题 被清华大学IC男神解决了!

▲清华(hua)大学微电(dian)子所提供的Thinker芯片的显(xian)微照(zhao)片

Thinker可以(yi)嵌入(ru)到(dao)很多小型设备中,包括(kuo)智能(neng)手机(ji)、手表、家用(yong)机(ji)器人、或远程控制的(de)仪器设备等(deng)。目前,研究团队与厂(chang)商沟通Thinker芯(xin)片的(de)产(chan)业(ye)化方案,此前也有报(bao)道称最(zui)快今年三月我们就能(neng)看到(dao)第一(yi)款搭载Thinker芯(xin)片的(de)端智能(neng)产(chan)品。不过(guo)清华微电子(zi)所将会将这一(yi)技术授权予企业(ye)使用(yong),高校本身不会进行产(chan)业(ye)化。

魏少军教授说,清华微电子所在(zai)(zai)可重(zhong)构计(ji)算(suan)上已经投入了十多年的(de)(de)(de)研(yan)发(fa),此前(qian)一(yi)直(zhi)将重(zhong)心(xin)放在(zai)(zai)在(zai)(zai)其他(ta)芯片的(de)(de)(de)研(yan)究上,将这(zhei)一(yi)架构用(yong)于AI芯片的(de)(de)(de)设计(ji)并(bing)(bing)且能取得如此好(hao)的(de)(de)(de)效(xiao)果,完全是(shi)“意外之喜”。下一(yi)步(bu),可重(zhong)构计(ji)算(suan)团队将会加(jia)大基(ji)础研(yan)究(尤其是(shi)编译器等相关软件)的(de)(de)(de)研(yan)发(fa)投入,并(bing)(bing)且进(jin)一(yi)步(bu)推(tui)动(dong)产业(ye)应用(yong)与企业(ye)合作的(de)(de)(de)进(jin)程(cheng)。

除(chu)了人工智(zhi)能(AI)外,这项技术在信息安全芯(xin)片、可编程逻辑器(qi)件(jian)、可穿戴计算芯(xin)片等(deng)领域都获得了批量应用(yong)。魏(wei)少军教授(shou)带领的可重构计算团队也获得了国家(jia)863计划(hua)两期(qi)支持、2015年国家(jia)技术发明二(er)等(deng)奖、2014年教育部技术发明一(yi)等(deng)奖等(deng)国家(jia)荣(rong)誉(yu)。

去年12月(yue),清华微电子(zi)所、澜起科技、英特尔还联(lian)合推出了基于此项技术研发(fa)的津逮服务(wu)器CPU,不仅(jin)能(neng)够大(da)(da)幅提升云端服务(wu)器的计算能(neng)效,还能(neng)实(shi)时监测、甄别和管控,极(ji)大(da)(da)增强CPU芯片(pian)的硬件(jian)安全性。

三、AI芯片广泛用于安防监控?“可能走错路了”

目前AI应用仍处(chu)于(yu)早期阶段,主要还是集中在互(hu)联网应用,需要在云端处(chu)理,端智能方面并没有(you)较(jiao)多普及。

在这(zhei)一(yi)轮兴起的(de)人(ren)工智能(AI)浪潮中,最(zui)为火热(re)、最(zui)频繁地被人(ren)提(ti)起的(de)落地行业(ye)莫过于安(an)(an)防(fang)了——或者更准确(que)来说,是(shi)基于安(an)(an)防(fang)监控(kong)摄像头的(de)人(ren)脸识别(bie)应(ying)用(yong)。这(zhei)不仅是(shi)众多AI芯片、AI平台应(ying)用(yong)厂商(shang)都(dou)在瞄准的(de)行业(ye),各(ge)家传统安(an)(an)防(fang)巨头也都(dou)跃跃欲(yu)试瞄准了AI+安(an)(an)防(fang)。

然(ran)而(er)在(zai)交谈中,魏少军(jun)教(jiao)授向智东西提到,现(xian)在(zai)的AI芯片应用在(zai)视频监控上,很有可(ke)能是(shi)走(zou)错路(lu)了。

由于目前的安防(fang)监(jian)控智能化还(hai)是以人(ren)脸识别为主,然而在广场、车站等远距离(li)、广泛监(jian)控的场景下,根本没可能看清人(ren)脸,

这些场(chang)景的(de)人(ren)脸识别项目虽然是个看似纯技术角度可行的(de)项目,然而一旦设计光(guang)照、遮挡、摄像头清晰(xi)度、以及可承载(zai)的(de)芯片算力、网络带(dai)宽等工程化问题,情况就会变(bian)得非常(chang)复杂(za)。

AI芯片终极难题 被清华大学IC男神解决了!

▲2008年(nian)北京奥运会人脸票证

一位有着传统芯(xin)片厂商(shang)与(yu)安(an)(an)(an)防(fang)厂商(shang)双背景,曾参(can)与(yu)过2008年奥运会“刷(shua)脸门(men)票(piao)”、天(tian)安(an)(an)(an)门(men)广(guang)(guang)场(chang)安(an)(an)(an)防(fang)布控等项(xiang)目的AI芯(xin)片初创CEO也曾经告诉我类(lei)似的结(jie)果(guo),中远距离内大型(xing)广(guang)(guang)场(chang)内的人脸识别项(xiang)目——比如天(tian)安(an)(an)(an)门(men)广(guang)(guang)场(chang)人脸识别项(xiang)目——根据(ju)去年天(tian)安(an)(an)(an)门(men)分(fen)局的调研结(jie)果(guo)显(xian)示,这项(xiang)目仍旧有着巨大的实(shi)现难度,是个美好的“理论幻想”。

如果我(wo)们按照(zhao)智能摄像头车(che)牌识别(bie)(bie)的(de)技(ji)术(shu)类推(tui),经过了(le)十几年的(de)技(ji)术(shu)演进、形(xing)态(tai)变迁后,目前北京市共有65万路交通摄像头,其中能够进行(xing)智能车(che)牌识别(bie)(bie)的(de)只有公(gong)安(an)的(de)3000路、停车(che)场(chang)的(de)3万路,而(er)且是(shi)只有在光照(zhao)、画面对其等问题都解决了(le),才能在特定路口、特定场(chang)景下实现——而(er)人脸识别(bie)(bie)远比车(che)牌识别(bie)(bie)要复杂得(de)多。

因此,AI安防虽然可(ke)以在局部(bu)场景(比如(ru)中短距(ju)离、室内监控(kong)、门禁(jin)刷脸、车辆识别等(deng))落地(di),但(dan)是(shi)(shi)(shi)离真(zhen)正的安防广(guang)泛(fan)应用还(hai)差得很远。魏少(shao)军(jun)教授(shou)说,AI只是(shi)(shi)(shi)方法、AI芯(xin)片只是(shi)(shi)(shi)手段,但(dan)是(shi)(shi)(shi)最重要的还(hai)是(shi)(shi)(shi)AI的应用落地(di)。

结语:AI芯片2020年或将进入洗牌期

魏(wei)少军教授认为,我国的(de)芯片(pian)工艺(yi)(yi)技术与发达(da)国家相比,还存在(zai)两三代工艺(yi)(yi)的(de)差距;我们(men)(men)原来(lai)希望在(zai)2020年以前(qian),与国际最(zui)先(xian)进(jin)制造(zao)工艺(yi)(yi)水平(ping)的(de)差距,不(bu)要(yao)大(da)于两代,现在(zai)看来(lai)实现较(jiao)为困(kun)难。此(ci)外,在(zai)芯片(pian)行业(ye)的(de)人才、产(chan)能、研发、设计等几大(da)重(zhong)要(yao)因素上,我们(men)(men)的(de)产(chan)业(ye)缺口仍就比较(jiao)明显。

我(wo)国(guo)的(de)(de)(de)芯片(pian)产业目(mu)前在高(gao)端芯片(pian)的(de)(de)(de)发展(zhan)上遇(yu)到了很多挑战,如(ru)果(guo)我(wo)们依旧遵循传统的(de)(de)(de)架(jia)(jia)构(gou)以跟随的(de)(de)(de)脚步进行发展(zhan),将会始终落后于人——因(yin)此(ci),从芯片(pian)设(she)计底(di)层架(jia)(jia)构(gou)上的(de)(de)(de)创新尤为(wei)重要。目(mu)前我(wo)们在软件定义芯片(pian)、AI芯片(pian)等这(zhei)类传统芯片(pian)业的(de)(de)(de)“破(po)冰者”方面已经(jing)取得了不(bu)错的(de)(de)(de)研究成绩,值得加大(da)投入力(li)度。

魏少军教授认为,从产业(ye)发(fa)展(zhan)规律(lv)来看,在(zai)今明两(liang)年(nian)之(zhi)内AI芯片将持续火热,大家扎(zha)堆进入;但(dan)是(shi)到(dao)了2020年(nian)前后,则(ze)将会出(chu)现一批出(chu)局者,行业(ye)洗牌开始。由于目前AI算法还在(zai)不断(duan)演(yan)进汇总(zong)的(de)过程中,最终(zhong)的(de)成功(gong)与否则(ze)将取决于各(ge)家技术路径的(de)选择(ze)和(he)产品(pin)落地的(de)速度。


每日一头条

趋势·深度·犀利·干货,最专业的行业解读

深喉(hou)爆料(liao)、投稿(gao):guoren@k193.net

AI芯片终极难题 被清华大学IC男神解决了!