智东西(公众号:zhidxcom)
文 | 白鸽

3月(yue)9日(ri),由智东(dong)西(xi)主办,极果和(he)(he)AWE联(lian)合(he)举(ju)办的(de)(de)中国首(shou)场(chang)(chang)AI芯(xin)(xin)片峰会在上海浦东(dong)成功举(ju)办。本次大会共(gong)吸引近(jin)万(wan)名观(guan)众(zhong)参加,到场(chang)(chang)人(ren)数比预计翻了3倍。即使是下午场(chang)(chang),依然爆满,有的(de)(de)观(guan)众(zhong)宁愿站(zhan)着也要听(ting)完全场(chang)(chang)。在大会现场(chang)(chang),近(jin)40位人(ren)工智能及AI芯(xin)(xin)片业界翘楚(chu)共(gong)聚一(yi)堂,系统地探讨了AI芯(xin)(xin)片在2018年的(de)(de)技(ji)术(shu)前景和(he)(he)产业趋势。

在特(te)邀演(yan)讲(jiang)嘉宾(bin)中(zhong),英(ying)特(te)尔中(zhong)国研究院认(ren)(ren)知计(ji)算实验室主任陈玉荣博士以《发掘AI芯片能(neng)力 提升(sheng)认(ren)(ren)知计(ji)算新高度》为主题进(jin)行演(yan)讲(jiang),系统阐(chan)述英(ying)特(te)尔在认(ren)(ren)知计(ji)算、情感识别、人脸(lian)分析技术以及(ji)软硬件结(jie)合(he)等方(fang)面的(de)成果。以下是(shi)由智东西(xi)为您整(zheng)理的(de)陈玉荣博士大会演(yan)讲(jiang)干货。

一、认知计算

开场,陈玉荣博(bo)士就详(xiang)细的阐(chan)述了何(he)为认(ren)知计算。他表(biao)示(shi),认(ren)知计算是一(yi)套计算机技术(shu),用(yong)以模拟人类感知、智能(neng)和解决(jue)问题(ti)的能(neng)力(li)。

认知(zhi)(zhi)计算如金(jin)字塔结构一样,具有多(duo)个层次(ci)。其(qi)最底层则是用过各种传感(gan)(gan)器(qi)进行感(gan)(gan)知(zhi)(zhi),如麦克风、摄像(xiang)头以(yi)及(ji)其(qi)它(ta)传感(gan)(gan)器(qi)等(deng),然后(hou)基于(yu)对感(gan)(gan)知(zhi)(zhi)数据(ju)的(de)(de)识(shi)(shi)(shi)别(bie)(bie),包括对声音(yin)、语(yu)音(yin)等(deng)音(yin)频(pin)信号(hao)的(de)(de)识(shi)(shi)(shi)别(bie)(bie);对物体、手势(shi)、人脸等(deng)视觉的(de)(de)识(shi)(shi)(shi)别(bie)(bie);以(yi)及(ji)其(qi)他的(de)(de)传感(gan)(gan)信号(hao),如位置、生物特征等(deng)的(de)(de)识(shi)(shi)(shi)别(bie)(bie)。

在识别基础上就是对多模态语(yu)义(yi)的(de)理解(jie),包括对各种结(jie)构化和(he)非(fei)结(jie)构化数据的(de)理解(jie),如文(wen)本、语(yu)音、视觉、情感等。最后,到最顶层才是基于理解(jie)的(de)认(ren)知,包括对上下(xia)文(wen)语(yu)境的(de)认(ren)知,以及对自然人机交互、计划与(yu)行动(dong)、类人记(ji)忆、适应(ying)用(yong)户的(de)需求和(he)愿望等的(de)认(ren)知。

事实(shi)上,认知计算的发(fa)展和(he)应用是(shi)一个(ge)过程,它是(shi)机器学(xue)习(xi)算法和(he)传统知识工程扩(kuo)展结合的结果,其总体目标是(shi)提高个(ge)人和(he)组织(zhi)的生产(chan)力(li)、创造力(li)。

二、深度学习的部署难题及解决方案

近年(nian)来(lai),认知计(ji)算所取(qu)得(de)的(de)突破仍停留在(zai)识(shi)(shi)别的(de)层次上(shang)。得(de)益于(yu)深(shen)度学习的(de)快速发展,目前计(ji)算机已经能够(gou)在(zai)图(tu)像识(shi)(shi)别,语(yu)音识(shi)(shi)别等(deng)领域达到(dao)或(huo)超过人的(de)平(ping)均水平(ping)。

深度(du)(du)学(xue)习也被广泛应(ying)用到其他的领(ling)域,如(ru)医疗诊断里(li)的肿瘤监(jian)测、投资分析里(li)面的文档分类、智能交互的语音助手、工业(ye)应(ying)用里(li)的产品缺陷监(jian)测、生物工程当中的基因测序(xu)等(deng)。但(dan)深度(du)(du)学(xue)习也存(cun)在挑战,如(ru)需要用大量标注数据、计算资源来进行训(xun)练(lian),这(zhei)是深度(du)(du)学(xue)习的训(xun)练(lian)挑战,但(dan)陈(chen)玉荣博士所要阐述的则是深度(du)(du)学(xue)习的部署挑战。

以(yi)视觉识别(bie)为(wei)例,为(wei)了提高识别(bie)准确率,目前主流(liu)的设(she)计方法(fa)有(you)两(liang)种,其一是将卷(juan)积神(shen)经网络设(she)计的越(yue)来越(yue)深(shen)。其二(er),卷(juan)积神(shen)经网络可以(yi)设(she)计的不那(nei)么深(shen),但一定要(yao)足够宽。使用这两(liang)种方法(fa)就会带来一个问题,即目前主流(liu)的模型参数通(tong)常是上(shang)(shang)(shang)千万、上(shang)(shang)(shang)亿甚至更多,这就导致计算(suan)空间(jian)、存(cun)储(chu)空间(jian)的复(fu)杂性非常大,这样就很难将其部署在(zai)计算(suan)和(he)存(cun)储(chu)资源受限的嵌入(ru)式、边(bian)缘设(she)备上(shang)(shang)(shang)。

为(wei)了(le)解决上述挑战,除了(le)进(jin)行有针对性的(de)高(gao)效(xiao)网络(luo)设计以外,另一个主要的(de)办法就(jiu)是进(jin)行DNN模型压缩。

英特尔在此(ci)方向(xiang)上(shang)提(ti)出了(le)一套低(di)(di)精(jing)度(du)的(de)(de)深度(du)压(ya)缩解决(jue)方案,它可以(yi)将DNN的(de)(de)权重参数(shu)和(he)激活值表述成低(di)(di)精(jing)度(du)的(de)(de)二进制表示(shi),并且,可以(yi)实现(xian)百倍级的(de)(de)无损(sun)压(ya)缩,这样就为(wei)深度(du)学习推断在硬(ying)件和(he)软件上(shang)的(de)(de)加速奠定了(le)基础(chu)。

该解决方案共包括了三个关键模块:

1、优化DNN结构的(de)(de)动态网络手术算法DNS。它可以(yi)将任意(yi)的(de)(de)DNN模(mo)型(xing)变成疏松的(de)(de)DNN模(mo)型(xing),但是不(bu)会损失(shi)模(mo)型(xing)的(de)(de)识别准确率。

2.渐进网络(luo)量(liang)化技(ji)术INQ,它可以(yi)将给定(ding)的(de)DNN模(mo)型(xing)权(quan)重(zhong)参数(shu)变成(cheng)低精度的(de)二(er)进制表示,同样保证不会降(jiang)低模(mo)型(xing)的(de)识别准确率。

3.多尺度的编码量化(hua)MLQ,它可以把DNN模型的激活值变成给定位框(kuang)的低(di)精度表示,同样不会(hui)降低(di)模型的识别(bie)准确(que)率。

通过(guo)把这三(san)个(ge)技术结(jie)合起来,就(jiu)形成了(le)一套完整的(de)、低精度的(de)深度压缩解决方(fang)案。

接(jie)下来,陈玉荣博士(shi)详细阐述(shu)了(le)INQ技术原理。他表(biao)示,INQ技术通(tong)过三个(ge)(ge)创(chuang)新的(de)操作,即参数(shu)划分、分组量化、重训练,从而使(shi)得(de)整(zheng)个(ge)(ge)量化过程(cheng)变成(cheng)一个(ge)(ge)渐进式的(de)操作过程(cheng),同时保证不会降低(di)模(mo)(mo)型的(de)识别准确(que)率。INQ是第(di)一个(ge)(ge)无损的(de)DNN量化压(ya)缩的(de)解决方(fang)案(an),它没有对任何网(wang)络模(mo)(mo)型类型进行假(jia)设(she),这意味着(zhe),它不仅可以(yi)用在(zai)卷积(ji)网(wang)络模(mo)(mo)型CNN上,也还可以(yi)用在(zai)其他网(wang)络模(mo)(mo)型上。

此外,因其是(shi)二进制表示,所以通(tong)过INQ技(ji)术与量(liang)化(hua)的(de)模型(xing)可(ke)以使大(da)部(bu)分的(de)乘法操作变成简单的(de)一位(wei)操作,同时采用(yong)专(zhuan)门的(de)硬件(jian)就可(ke)以实现(xian)很高的(de)加速。另外,量(liang)化(hua)技(ji)术是(shi)基于(yu)预训练模型(xing)的(de),也就是(shi)说不需要从头(tou)开始训练,那么(me)这样量(liang)化(hua)的(de)效率很高。

通过对主(zhu)流的(de)DNN模型(xing)进行实验,在(zai)5比(bi)特量(liang)化(hua)的(de)结(jie)果显示其量(liang)化(hua)模型(xing)的(de)准确率(lv)不但没有降低(di)反(fan)而有所增加,在(zai)超低(di)精度(du),也就是在(zai)2/3比(bi)特的(de)量(liang)化(hua)结(jie)果也显示其识别准确率(lv)非常接近全精度(du)的(de)参(can)考模型(xing)。

三、促进深度学习推断硬件加速

针对深(shen)度学习,英特尔提供了多种技术解决(jue)方案,涵(han)盖了从数据中心到边缘端的训(xun)练和(he)推(tui)断。

通(tong)过将低(di)精度(du)(du)(du)深度(du)(du)(du)压(ya)缩(suo)技术(shu)与英(ying)特尔的(de)低(di)功(gong)耗(hao)硬件(jian)(jian)结合,就可以(yi)为雾计算、边缘计算提供深度(du)(du)(du)学习推断(duan)的(de)硬件(jian)(jian)加(jia)速(su)(su)能(neng)力。例如,通(tong)过采(cai)用FPGA(现场可编(bian)程(cheng)门列)友(you)好的(de)DNN设计,并结合低(di)精度(du)(du)(du)深度(du)(du)(du)压(ya)缩(suo)技术(shu),就可以(yi)在(zai)雾计算应用场景提供更快的(de)速(su)(su)度(du)(du)(du)、更近的(de)延(yan)迟和能(neng)耗(hao)以(yi)及更高的(de)吞吐量。

英特尔最新的Movidius超级功耗视觉处理单(dan)元(yuan)Myriad X VPU已经具备了神经网络计算(suan)(suan)(suan)加速的引擎——NCE,将来把它(ta)与压缩技术结合,就(jiu)可以实现(xian)低精度的DNN计算(suan)(suan)(suan)。这样,就(jiu)可以进一步提高在(zai)边缘计算(suan)(suan)(suan)上DNN的计算(suan)(suan)(suan)速度和吞吐量。

此外,英特尔(er)还研发出其他(ta)芯(xin)片,能够支持数据中(zhong)心和边缘端的(de)各(ge)种AI计(ji)算。如(ru)英特尔(er)凌(ling)动、酷(ku)睿和至(zhi)强(qiang)处(chu)理器就可以对(dui)诸如(ru)机器学习、认知推理等(deng)通用(yong)AI的(de)算法进行计(ji)算,如(ru)果算力不够,还可以用(yong)FPGA进行灵活(huo)加速。

在每种(zhong)CPU的基础之上,英(ying)特(te)尔还会提供广泛的加速器组合,以便满足不同用户的需求。如英(ying)特(te)尔的Nervana神经网络处理器,就是专(zhuan)门针(zhen)对深(shen)度学习(xi)设计,它可以对高(gao)强度的深(shen)度学习(xi)训练和推断进行(xing)加速。另外针(zhen)对视觉、语音、音频(pin)以及自动驾驶等方(fang)面的处理,还有专(zhuan)门的英(ying)特(te)尔的Movidius VPU、GNA以及Mobileye EyeQ芯(xin)片来进行(xing)专(zhuan)门加速。

然(ran)而,光(guang)有芯片是(shi)不够(gou)的(de),为此(ci),英(ying)特尔(er)还提(ti)供了(le)端到端的(de)AI全(quan)栈(zhan)解决方案。其中包括多(duo)种(zhong)计算、存储网络硬件平(ping)台;多(duo)种(zhong)软件工(gong)具、函(han)数库;优(you)化的(de)开源框架(jia)以及各种(zhong)人工(gong)智(zhi)能(neng)平(ping)台。

未(wei)来,英(ying)特尔(er)研(yan)究(jiu)院(yuan)也在进行其他领域的研(yan)究(jiu),包(bao)括(kuo)先进算法(fa)、神经(jing)拟态芯片、自(zi)主系(xi)统(tong)、量子(zi)计算。在今(jin)年的CES上(shang),英(ying)特尔(er)研(yan)究(jiu)院(yuan)发布了代(dai)号Loihi神经(jing)拟态芯片,以(yi)及代(dai)号为(wei)Tangle Lake的具有49个(ge)量子(zi)比(bi)特的超导量子(zi)测(ce)试芯片。

四、软硬协同提升对“人”的认知

英(ying)(ying)特(te)(te)尔人(ren)脸(lian)分析研究始于(yu)2011年(nian),其中共经(jing)历了三个(ge)阶段。早期采(cai)用(yong)比较传统的(de)算(suan)法实(shi)现了人(ren)脸(lian)检(jian)(jian)测(ce)(ce)(ce)识别(bie)(bie)、微笑检(jian)(jian)测(ce)(ce)(ce)、性别(bie)(bie)年(nian)龄(ling)识别(bie)(bie)等简单功能。之后结(jie)合英(ying)(ying)特(te)(te)尔架构(gou)进行软硬件协同设计,采(cai)用(yong)更(geng)(geng)高效的(de)人(ren)脸(lian)检(jian)(jian)测(ce)(ce)(ce)识别(bie)(bie)算(suan)法,实(shi)现更(geng)(geng)完整的(de)功能,包(bao)括人(ren)脸(lian)关键(jian)点检(jian)(jian)测(ce)(ce)(ce)跟踪、动态人(ren)脸(lian)表情(qing)识别(bie)(bie)等。目前,英(ying)(ying)特(te)(te)尔最新人(ren)脸(lian)分析技术则是(shi)利用(yong)了基于(yu)深度学习(xi)的(de)高效网(wang)络结(jie)构(gou)设计。在(zai)实(shi)际应用(yong)场(chang)景中,其功耗很低。

此外,英特(te)尔(er)还(hai)实现了三维人脸分析,包(bao)括三维人脸建模和(he)增强。陈(chen)玉荣博士介(jie)绍(shao),他(ta)们研发的(de)先进(jin)的(de)2D人脸技术已经被(bei)集(ji)成到英特(te)尔(er)软硬件当中,如英特(te)尔(er)的(de)集(ji)成显卡、实感(gan)技术SDK等,进(jin)一步提高了英特(te)尔(er)用户的(de)视觉体(ti)验。

在基于2D人(ren)脸(lian)分析技术上,英(ying)特尔还开发了(le)一(yi)套3D人(ren)脸(lian)分析技术,通过(guo)该(gai)技术,使(shi)用普(pu)通的(de)(de)笔记(ji)本(ben)电(dian)脑就可(ke)以(yi)(yi)实现(xian)实时的(de)(de)三(san)维人(ren)脸(lian)建模、跟踪和增(zeng)强(qiang)。在会上,陈玉(yu)荣博士演示了(le)用参数(shu)化表示的(de)(de)三(san)维人(ren)脸(lian)形变模型,它可(ke)以(yi)(yi)用来模拟任何人(ren)的(de)(de)相貌、脸(lian)形、表情变化等。这项技术可(ke)以(yi)(yi)广(guang)泛用在虚(xu)拟现(xian)实、游戏(xi)场景当中,从而进一(yi)步提(ti)升(sheng)用户的(de)(de)沉浸式体验。

除对(dui)人脸分(fen)析(xi)之外,对(dui)情感的计算也是(shi)认(ren)知计算的重要方面。

对于人类来说,声音、表情(qing)是表达(da)情(qing)感(gan)的(de)(de)最主要(yao)的(de)(de)方式。英特(te)尔通过(guo)对情(qing)感(gan)识别(bie)算(suan)法(fa)的(de)(de)研究,在2015年(nian)(nian)就提出了基(ji)(ji)于人工定义特(te)征的(de)(de)人脸(lian)表情(qing)识别(bie)算(suan)法(fa),并基(ji)(ji)于算(suan)法(fa)研发出了一(yi)套音视(shi)频情(qing)感(gan)解决方案。该方案在2015年(nian)(nian)举办(ban)的(de)(de)非受限的(de)(de)音视(shi)频情(qing)感(gan)识别(bie)挑战(zhan)赛(sai)EmotiW2015中获(huo)得第一(yi)名。

2016年,英特尔研发出(chu)了全(quan)新(xin)的(de)(de)深(shen)度(du)(du)神经网络算(suan)法HoloNet,其速度(du)(du)很(hen)快,在(zai)普通(tong)(tong)的(de)(de)CPU上运行速度(du)(du)可达(da)百帧每秒。这样可以(yi)满足机器(qi)人、智能家(jia)居、在(zai)线教育应(ying)用(yong)场(chang)景(jing)的(de)(de)使用(yong)需求。2017年,英特尔又提出(chu)了全(quan)新(xin)聚合(he)监督的(de)(de)情感识别(bie)算(suan)法,该算(suan)法取(qu)得了单模型比HoloNet高5.5%的(de)(de)识别(bie)率(lv),通(tong)(tong)过多(duo)模型的(de)(de)融合(he)在(zai)去年比赛当中再(zai)次获得第一名。

GTIC2018 | 英特尔陈玉荣:情感识别认知计算的三年发展之路