车东西(公众号:chedongxi)
文 | Origin

3月9日,上(shang)周五,由(you)智东(dong)西主办的GTIC 2018全球AI芯片创新峰会在上(shang)海召开,大(da)会邀请到(dao)来(lai)自芯片、安防(fang)、汽车和(he)消费电子(zi)等领域(yu)的近(jin)40位业界翘楚到(dao)场分享研发AI芯片的经历(li)与思考。

数千(qian)名到场(chang)观众挤爆(bao)了会场(chang),AI芯片话题火(huo)热(re)可(ke)见(jian)一斑。

在(zai)大会下午(wu)场的“自动驾驶加速落地(di),AI芯片引领计(ji)算平(ping)台”板(ban)块(kuai),眼擎科技CEO朱继志进行了主题为《成像(xiang)引擎芯片进入视觉2.0时代》的演讲(jiang),就人工智能(neng)最大应用方(fang)(fang)向——机(ji)器视觉在(zai)成像(xiang)上的痛点,分(fen)享(xiang)了眼擎科技的解(jie)决(jue)方(fang)(fang)案(an),并分(fen)析了其在(zai)自动驾驶领域的应用。

朱(zhu)继(ji)志演讲的要点,车东西整理如下。

一、AI时代急需机器之眼

朱继志此(ci)前在(zai)图像(xiang)处理行业(ye)和芯片分(fen)销(xiao)行业(ye)任(ren)职,2014年(nian)他主导成立了眼擎科技。如(ru)其(qi)公司名,眼擎所做的(de)工作即面向(xiang)机(ji)(ji)器视觉(jue)打造对标人眼的(de)成像(xiang)引擎,用(yong)芯片+算法的(de)方(fang)式提高机(ji)(ji)器视觉(jue)前端的(de)成像(xiang)能力,让AI有更高质量的(de)图像(xiang)数据可用(yong)。

GTIC 2018 | 眼擎科技朱继志:PK人眼的无人车之眼如何炼成

▲眼擎(qing)科技(ji)CEO朱继志

朱(zhu)继(ji)志表示,AI这个(ge)巨大的(de)技术生态下,已经进化出各种各样(yang)的(de)新物种,比(bi)如(ru)自动驾驶(shi)汽车(che)。而过去几年AI的(de)大脑成(cheng)长得很快(kuai),但还需要一个(ge)最重要的(de)器官(guan)——眼睛。

目前绝大(da)多数(shu)AI物种都(dou)是(shi)(shi)基于视(shi)(shi)觉(jue)能力(li)成长起来,通过(guo)视(shi)(shi)觉(jue)生成的(de)(de)数(shu)据占据了AI世界绝大(da)部分的(de)(de)数(shu)据量,AI的(de)(de)时代将会(hui)是(shi)(shi)万(wan)物视(shi)(shi)觉(jue)的(de)(de)时代:一个(ge)汽(qi)车会(hui)配备10个(ge)以上的(de)(de)传感器(qi)、每家无人零售(shou)店会(hui)有超过(guo)100枚(mei)视(shi)(shi)觉(jue)传感器(qi)。自动驾驶、无人零售(shou)、机器(qi)人、手机相(xiang)机等领域,将会(hui)在未来五年内(nei)产生上百(bai)亿台的(de)(de)视(shi)(shi)觉(jue)设备需求。

GTIC 2018 | 眼擎科技朱继志:PK人眼的无人车之眼如何炼成

▲Uber早期无(wu)人车,以摄像头众(zhong)多著称(cheng)

但当下基于(yu)视觉(jue)的AI产品普(pu)遍(bian)遭遇(yu)到一个(ge)问题,在(zai)(zai)实验(yan)室内运(yun)行良好的AI视觉(jue)算法一落地,就从卖(mai)家秀变(bian)成了买(mai)家秀——复杂光线条件下,机器视觉(jue)的识别(bie)、判断能(neng)力显著(zhu)降低。自动驾驶汽车过(guo)隧道(dao),或者在(zai)(zai)夜间运(yun)行,在(zai)(zai)暗光、逆光条件下感(gan)知能(neng)力会遭遇(yu)很(hen)大挑战。

为(wei)此业(ye)界用上了很多辅助视觉的技术,比如无人车(che)使用的激光雷达(da)。但朱继(ji)志将(jiang)此比作为(wei)只是给了自动驾驶汽车(che)一根拐杖,并没有(you)将(jiang)视觉的能力发(fa)挥到(dao)极(ji)致。

与(yu)机器(qi)不同的(de)(de)是,人(ren)(ren)眼(yan)(yan)则(ze)对(dui)各种光线环境都有很好的(de)(de)适应(ying)能力(li)。为此,眼(yan)(yan)擎科技推出一套软件(jian)+硬(ying)件(jian)的(de)(de)解决方案(an),打造对(dui)应(ying)AI处理(li)需求的(de)(de)机器(qi)之眼(yan)(yan),对(dui)标人(ren)(ren)眼(yan)(yan)的(de)(de)视觉成像能力(li),甚至做得比人(ren)(ren)眼(yan)(yan)更好——目前眼(yan)(yan)擎的(de)(de)产品在(zai)成像的(de)(de)动态范围上比人(ren)(ren)眼(yan)(yan)高18db,在(zai)人(ren)(ren)眼(yan)(yan)无法(fa)辨别色(se)(se)彩(cai)的(de)(de)极弱(ruo)光条件(jian)下仍能输出清晰的(de)(de)彩(cai)色(se)(se)图(tu)片。

朱(zhu)继(ji)志称,未来(lai)五年(nian),机器视(shi)觉就(jiu)能够仅依靠(kao)被动光学成像(xiang)系统(tong),实现全天候(hou)的运行工作。

二、软硬结合方案PK人眼

为了自(zi)身掌(zhang)握的(de)(de)成像技术(shu)能够(gou)最(zui)大(da)限度(du)地发(fa)挥作用,眼擎将其近(jin)4年累积的(de)(de)针对二十余种场景的(de)(de)智能成像算(suan)法(fa)凝聚在了一枚成像芯片——eyemore X42之上,打造出软硬件一体化的(de)(de)成像引擎,专门(men)为各类(lei)机器(qi)视觉产品(pin)提(ti)供强大(da)的(de)(de)成像能力。

GTIC 2018 | 眼擎科技朱继志:PK人眼的无人车之眼如何炼成

朱(zhu)继志(zhi)介绍(shao),这款成像芯片有三大特(te)点:

一是(shi)芯片(pian)是(shi)非(fei)集成的,与英(ying)伟达的独(du)立显卡一样,眼擎采(cai)用了独(du)立芯片(pian)设计,拥有更(geng)强大的计算(suan)能(neng)力。

二是(shi)在各种智能(neng)成(cheng)像(xiang)算(suan)法加(jia)持(chi)下,它拥有(you)”视(shi)觉(jue)2.0”的能(neng)力,较传统的成(cheng)像(xiang)设备能(neng)够应对各种复杂光线,

第三(san)则是(shi)(shi)它提(ti)供了(le)大量API接(jie)口,让后端算法工程(cheng)师方便调用(yong),减小(xiao)开发难度,实现软件定义硬(ying)件。而传统的(de)智能摄像头(tou)设备并未提(ti)供太(tai)多(duo)接(jie)口,大多(duo)数时候都是(shi)(shi)一个(ge)黑(hei)盒(he)。

朱继志表示,根(gen)据(ju)他(ta)在芯(xin)(xin)片(pian)行业(ye)任职的经(jing)历来看,芯(xin)(xin)片(pian)的应用周期非常漫长,要推广一(yi)枚芯(xin)(xin)片(pian)难度也(ye)很大。为此(ci),眼(yan)擎为下(xia)游客(ke)户提供了(le)(le)对应产(chan)(chan)品不(bu)同(tong)开(kai)发(fa)阶段的各种方案:早(zao)期接触时可以(yi)使用开(kai)发(fa)工(gong)具,小规(gui)模生产(chan)(chan)验证产(chan)(chan)品时可以(yi)使用其模组,而(er)到了(le)(le)产(chan)(chan)品量产(chan)(chan)阶段眼(yan)擎就可直(zhi)接提供芯(xin)(xin)片(pian)。此(ci)外,眼(yan)擎还提供IP授权这类的合作形式,以(yi)更(geng)好地应对不(bu)同(tong)领域(yu)的需(xu)求。

GTIC 2018 | 眼擎科技朱继志:PK人眼的无人车之眼如何炼成

为了降低下游(you)公(gong)司的开发门槛,眼(yan)擎今(jin)年(nian)会(hui)面向各个领域推出完整解决方(fang)案的参(can)考(kao)设计。今(jin)年(nian)年(nian)中,眼(yan)擎为辅助驾驶提供(gong)的方(fang)案,视觉动态范围(wei)会(hui)超过100db,可(ke)以解决95%的复杂光线问题。

GTIC 2018 | 眼擎科技朱继志:PK人眼的无人车之眼如何炼成

面向无人零售、工业(ye)视觉,眼擎也(ye)会(hui)有板卡形(xing)式的方案推出(chu)。

目(mu)前(qian),眼擎的(de)芯片已(yi)经(jing)有实际应用(yong)案例。基于眼擎的(de)成像芯片,其客户打造了一台面向(xiang)淘宝卖家的(de)3D扫描(miao)仪(yi),用(yong)单目(mu)就实现了输(shu)出淘宝商(shang)品的(de)高质量三维图(tu)像。

朱继志(zhi)认(ren)为,目前各种(zhong)拍摄(she)设(she)备源自(zi)日本的成像架构,其初衷都(dou)是(shi)(shi)面向人设(she)计的,为的是(shi)(shi)满足人的主观审美(mei),但机器(qi)所需要的成像是(shi)(shi)客(ke)观的,机器(qi)的使命是(shi)(shi)用视(shi)觉(jue)测量世界,在前端(duan)的测量越(yue)精(jing)(jing)准,那么后端(duan)的识(shi)别结果就越(yue)精(jing)(jing)确。

机(ji)器在(zai)视觉能力上(shang)做(zuo)到超越人眼(yan)后,将会(hui)发现(xian)一个新(xin)世界——比如(ru)医生(sheng)可以通过病人的(de)脸(lian)色来看诊,而机(ji)器在(zai)视觉能力上(shang)如(ru)果超过医生(sheng)100倍,或许就将发现(xian)更(geng)多有价值的(de)信息。而这也(ye)是AI产业(ye)的(de)终极进化方向(xiang)。

三、AI芯片的三大趋势

在谈到眼下的AI芯片浪潮(chao)时(shi),朱(zhu)继志(zhi)认为(wei)其中(zhong)有三大重要趋势。

第一,眼下AI芯片是以视(shi)觉处(chu)(chu)理为核心(xin)的(de)。无论是在PC时代(dai)还是移(yi)动互联网时代(dai),所有的(de)芯片处(chu)(chu)理工(gong)作(zuo)都(dou)围绕CPU展开(kai)(kai),而现(xian)在开(kai)(kai)始(shi)以视(shi)觉为中心(xin)的(de)处(chu)(chu)理工(gong)作(zuo)让CPU的(de)地位开(kai)(kai)始(shi)滑落(luo)。

第二,AI芯片产(chan)业(ye)目前是(shi)去(qu)中心化的(de)(de)。以前的(de)(de)操(cao)作(zuo)(zuo)系统与CPU绑定,主芯片只有数(shu)枚,以CPU为中心开展(zhan)工作(zuo)(zuo)。结果(guo)是(shi)越(yue)来(lai)越(yue)通用(yong)、功能越(yue)来(lai)越(yue)多,但产(chan)品却趋同。而人工智能时(shi)代对芯片对的(de)(de)要求会具(ju)体到(dao)每一个场景,这(zhei)是(shi)通用(yong)型(xing)处理器(qi)所不及的(de)(de)。细分(fen)行(xing)业(ye)的(de)(de)应(ying)用(yong)需(xu)求成就了AI芯片的(de)(de)兴起。

第三(san),AI芯片对(dui)(dui)应了工业(ye)(ye)升级(ji)的(de)(de)要求。过去二十年(nian)中互联网产业(ye)(ye)是绝对(dui)(dui)的(de)(de)明(ming)星产业(ye)(ye),很多工业(ye)(ye)产品(pin)被(bei)淡化(hua)。而(er)人工智(zhi)能时代(dai)工业(ye)(ye)升级(ji)对(dui)(dui)AI芯片提出了极大的(de)(de)需(xu)求。

正是因为这三(san)点趋(qu)势,AI芯片架构呈现去中心化的(de)态势,才会有大量(liang)的(de)初创公(gong)司(si)杀入芯片行业(ye),与(yu)传统的(de)芯片巨(ju)头(tou)们同(tong)场竞技。

朱继(ji)志做了一个(ge)类比,在(zai)被智能化(hua)、电动化(hua)趋势(shi)改(gai)造(zao)(zao)的汽车产业(ye),同样有一批新(xin)(xin)(xin)造(zao)(zao)车公(gong)司涌现(xian)。在(zai)新(xin)(xin)(xin)趋势(shi)带来的产业(ye)变革下,原本(ben)相(xiang)对(dui)固定的格局往往会被打破,率(lv)先(xian)对(dui)新(xin)(xin)(xin)趋势(shi)作(zuo)出反(fan)映,改(gai)造(zao)(zao)乃(nai)至革新(xin)(xin)(xin)原有的技术/商业(ye)架构,是眼擎这类创业(ye)公(gong)司的机(ji)会所(suo)在(zai)。汽车行业(ye)如此,芯片行业(ye)亦然。

结语:芯片初创如何在AI时代掘金?

从(cong)眼(yan)擎的创业道(dao)路来看,AI无疑是其成长最好(hao)的东(dong)(dong)风。但清华(hua)大学微(wei)纳(na)电(dian)子(zi)系主任(ren)、微(wei)电(dian)子(zi)所所长魏(wei)少军在GTIC 2018上(shang)坦言(yan),未(wei)来2-3年(nian),AI芯片(pian)初创公司就(jiu)将出现先烈。那么,对(dui)于眼(yan)擎这样(yang)初创,要怎么在日趋激烈的人(ren)工智能(neng)竞赛(sai)中生存壮大?演(yan)讲结束后,朱继(ji)志接受了智东(dong)(dong)西的采访。

他认为除了技术之外,找到行业(ye)最(zui)需要(yao)解(jie)决的痛(tong)点是最(zui)重要(yao)的。能(neng)(neng)够解(jie)决的痛(tong)点越紧要(yao)、解(jie)决痛(tong)点的能(neng)(neng)力越不可(ke)复制,那(nei)么(me)创业(ye)公司(si)的护(hu)城(cheng)河就越宽(kuan)。

其次,以(yi)眼擎的(de)(de)经验(yan)来(lai)看,由于(yu)AI技(ji)术的(de)(de)大(da)量落脚点(dian)在于(yu)升(sheng)级传统产业(ye),AI相关(guan)技(ji)术产品落地中(zhong)遇到的(de)(de)最大(da)难点(dian)其实在于(yu)信息不对等(deng),即(ji)后(hou)端应用对前段技(ji)术的(de)(de)不了解、不信任。对于(yu)这种情况,比较重要(yao)的(de)(de)手段是针对不同的(de)(de)行(xing)业(ye)推(tui)出参考设(she)计,降低技(ji)术应用门(men)槛与陌生度。

此(ci)外朱继志(zhi)认为,由于大公(gong)司在数据量(liang)上的(de)优势,纯做算法(fa)研发的(de)人(ren)工智能公(gong)司会比(bi)(bi)较危险,对(dui)于人(ren)工智能初创公(gong)司来(lai)说,虽然软硬结合是一种门槛比(bi)(bi)较高的(de)方式,但也是能够更好保证初创公(gong)司生存(cun)的(de)模式。

GTIC 2018 | 眼擎科技朱继志:PK人眼的无人车之眼如何炼成