芯东西(公众号:aichip001)
作者 | ZeR0
编辑 | 漠影
在(zai)系统(tong)芯片开(kai)发过(guo)程中(zhong),软硬件(jian)协同设计愈(yu)发成为一个“基本功(gong)”。
相比完全倚仗芯片的(de)硬件设(she)计,与软件的(de)适(shi)配(pei)协同开发能(neng)够更(geng)充分地挖掘(jue)算力(li),使芯片在实际应用(yong)中更(geng)好发挥出(chu)性能(neng)优势。
尤其是高速创新的(de)(de)人(ren)工智能(AI)领域(yu),软件迭代的(de)(de)速度(du)如此之快,固化的(de)(de)硬件设(she)计难以满足(zu)蓬勃生长的(de)(de)算力(li)需(xu)求,这促使满足(zu)未来(lai)需(xu)求的(de)(de)硬件与软件间的(de)(de)结合变得(de)十分(fen)关(guan)键。
在这个话题上,一直(zhi)探(tan)索(suo)将总部位(wei)于英国的知名半导体IP供(gong)应商Imagination Technologies相当有(you)发(fa)言权。
从IP设计之初,Imagination便将能做“计算”的(de)核放在一(yi)起做资源(yuan)优化(hua),目前(qian)其产品线(xian)覆盖GPU、AI、CPU三大(da)领域,同时(shi)打造有IMG DNN SDK软(ruan)件平台。其中GPU可多核扩展支持6TFLOPS的(de)算力,AI加(jia)速(su)器可支持到(dao)100TOPS乃至(zhi)超过5000TOPS的(de)算力。
近日,Imagination Technologies产品总监Rob Fisher在与芯东西进行的(de)(de)远(yuan)程(cheng)交流(liu)期(qi)间,从AI专(zhuan)用芯片IP硬件核设计的(de)(de)角度分享(xiang)了(le)更多的(de)(de)经验之谈(tan)。
▲Imagination Technologies产品总监Rob Fisher
Rob Fisher特别强调了一些设计要点:在软件设计方面,必须具备快速制作新架构原型并测试新架构的能力;在硬件设计方面,必须选择合适的加速粒度以兼顾灵活性和性能。
在他看来,软硬协同设计对于保证最灵活、最具适应性的解决方案至关重要。要获得最大的收益,应在IP核的设计阶段就开始软硬协同设计,而不是等到选择IP的时候才开始。“Imagination重视软硬协同设计,并(bing)将完(wan)整的编程模型(xing)视为IP开发的一部分。”Rob Fisher说。
从2015年(nian)起,Imagination就开始投(tou)入研发AI专用(yong)芯(xin)片(pian)IP核,从2NX、3NX到2020年(nian)推出的4NX,其(qi)产品(pin)一路迭代,性能也从0.5TOPS、12.5TOPS攀(pan)升至100TOPS甚(shen)至更(geng)高。在(zai)做AI硬(ying)(ying)件加速时,Imagination进行了软(ruan)硬(ying)(ying)件一体配套设计(ji),并(bing)与(yu)芯(xin)片(pian)公司合作探索如何从IP层面实现(xian)软(ruan)硬(ying)(ying)件更(geng)深(shen)度的融合。
开发AI硬件和软件需要投入大量资源,来确保架构的可编程性与适应性足以满足未来的需求,同时实现高吞吐量以及低功耗、小面积和低带宽。
在这方面,Imagination已经积累(lei)了7年的(de)AI加(jia)速器开发经验。Rob Fisher认(ren)为,没有足(zu)够(gou)的(de)知识积累(lei),很难开发出像Imagination PowerVR NNA这样(yang)的(de)高性能IP。
他告诉芯(xin)东(dong)西(xi),Imagination了(le)解在某些情况(kuang)下,标准的(de)优化(hua)和工具流程无法充(chong)分发挥硬件(jian)的(de)潜力或满(man)足特定(ding)的(de)部署限制(如(ru)带宽(kuan)),此时(shi)可以进(jin)行(xing)进(jin)一(yi)步(bu)的(de)分析(xi)和优化(hua)。Imagination针对特定(ding)的(de)AI和计(ji)算工作负载进(jin)行(xing)了(le)优化(hua),例(li)如(ru)在同时(shi)使用SIFT和计(ji)算机视觉算法与机器(qi)学习的(de)案例(li)中,Imagination团队经过分析(xi)后在PowerVR GPU上展示了(le)业界领先的(de)加速能力。
Imagination希(xi)望(wang)通过产业化的(de)(de)(de)软件(jian)平台(tai),将(jiang)AI框(kuang)(kuang)架解析过来的(de)(de)(de)工作通过DNN最终(zhong)部署到合适的(de)(de)(de)硬(ying)件(jian)平台(tai)。例如(ru),Imagination的(de)(de)(de)PowerVR GPU和PowerVR NNA,采用一(yi)体(ti)化的(de)(de)(de)IMG DNN API的(de)(de)(de)设计,使(shi)(shi)其客户可以(yi)很容易地使(shi)(shi)用同一(yi)套API,向上适配TensorFlow、Caffe、百度(du)飞桨等业界(jie)主流框(kuang)(kuang)架,向下适配NNA only或GPU+NNA等不同的(de)(de)(de)硬(ying)件(jian)方案。
看向未来,要实现硬件对更多AI框架及算法的适配与融合优化,Rob Fisher认为加速粒度将是实现软件优化和算子融合的关键。
软硬(ying)一体已(yi)(yi)是未来AI发展的(de)主流(liu)趋(qu)势(shi)。随(sui)着AI技(ji)术更(geng)(geng)加成熟并进(jin)入更(geng)(geng)广泛的(de)行业应(ying)用中(zhong)(zhong),业界(jie)已(yi)(yi)从分工(gong)独立的(de)硬(ying)件(jian)算力驱动和(he)算法(fa)创新驱动走向算法(fa)与硬(ying)件(jian)协同创新阶段。这将(jiang)需要更(geng)(geng)多业界(jie)的(de)软硬(ying)件(jian)企业增(zeng)进(jin)合作,探(tan)索如何将(jiang)芯片设计(ji)与软件(jian)形成更(geng)(geng)好的(de)结(jie)合,以在更(geng)(geng)适合的(de)落(luo)地场(chang)景(jing)中(zhong)(zhong)将(jiang)落(luo)地部署的(de)硬(ying)件(jian)性能发挥(hui)到最(zui)佳水平。