智东西(公众号:zhidxcom)
编译 | 徐珊
编辑 | 云鹏

智东西(xi)7月(yue)16日消息(xi),据外媒(mei)Tech Xplore报道,南加(jia)州大学(xue)的研究团队(dui)在2021年学(xue)习(xi)代表国际会议发表了名为《基于组监督和(he)零样本的学(xue)习(xi)(Zero-Shot Synthesis with Group-Supervised Learning)》的论文,他(ta)们正在研究如(ru)何让AI模仿人类的想象过程,以(yi)合成或了解从未见过的事物。

当我(wo)们去想象一只(zhi)猫在长(zhang)城上奔跑时,我(wo)们大(da)(da)脑中的(de)(de)一系列神(shen)经(jing)元将会被快(kuai)速(su)激活(huo),然后在大(da)(da)脑中呈现不(bu)同的(de)(de)图像(xiang)。这个(ge)想象的(de)(de)过(guo)(guo)程对人(ren)类来(lai)说(shuo)很(hen)简单,对于深度(du)神(shen)经(jing)网(wang)络(luo)系统来(lai)说(shuo)很(hen)难。尽管它在某些领域中取得了超(chao)过(guo)(guo)人(ren)类的(de)(de)表(biao)现,但该系统仍难以做到人(ren)类的(de)(de)“想象”。

研究人(ren)员通(tong)过解耦(Disentanglement)技术(shu)让AI产生与人(ren)类(lei)相似的“想象(xiang)力”,以(yi)合(he)成(cheng)不(bu)同属性的、前所(suo)未见的物体。研究人(ren)员认为,这项技术(shu)不(bu)但可(ke)以(yi)协助人(ren)们(men)合(he)成(cheng)新(xin)药(yao),而且还能提(ti)高自(zi)动驾驶汽车的安(an)全性,并且让人(ren)工智能消除数据(ju)算(suan)法(fa)带来的潜在偏见。

“我们受到人类视(shi)觉概括能力(human visual generalization capabilities)的(de)启发(fa),试图在AI中(zhong)模(mo)拟人类的(de)想象”,该(gai)研究(jiu)的(de)第一作(zuo)者(zhe)(lead author)葛(ge)云(yun)皓(hao)说,“人类可以按属性(例(li)如(ru)形状、姿势、位置、颜色)将他们已知的(de)信息分类,然后(hou)将它们重新组合去想象一个(ge)新的(de)事物。我们的(de)研究(jiu)主要(yao)通过(guo)(guo)神经网络系统(tong)模(mo)拟这个(ge)过(guo)(guo)程。”

一、AI难以分清事物的属性特征

事实上(shang),如(ru)果(guo)你想(xiang)让(rang)一(yi)个(ge)AI可(ke)以自行生成一(yi)张(zhang)汽(qi)(qi)(qi)车图(tu)像,理想(xiang)情况下(xia),您可(ke)以通(tong)过(guo)为这个(ge)AI提(ti)供几张(zhang)汽(qi)(qi)(qi)车的(de)图(tu)像,它就可(ke)以从(cong)颜色、类型等(deng)(deng)角度生成多种类型的(de)汽(qi)(qi)(qi)车,如(ru)红色的(de)保时捷,绿(lv)色的(de)皮卡等(deng)(deng)。

完(wan)成这类(lei)的任务是(shi)人们(men)(men)设计AI的长期目(mu)标之一——AI创(chuang)建可以推断的模型(models that can extrapolate)。这意(yi)味(wei)着当人们(men)(men)给AI几个样(yang)本(ben)时,AI就应该能从这些样(yang)本(ben)中(zhong)提取(qu)基本(ben)的共性,并将它们(men)(men)应用于大量(liang)的新(xin)事物中(zhong),即便AI此前(qian)从未见(jian)过这样(yang)的事物。但是(shi)目(mu)前(qian)AI最(zui)常接受的样(yang)本(ben)特征训练是(shi)像素等,这些并不需要考虑对象的属性。

比如(ru)说,长(zhang)(zhang)方(fang)形(xing)的(de)(de)木(mu)板(ban),具有长(zhang)(zhang)方(fang)形(xing)、木(mu)质、板(ban)等属性,但AI并不(bu)清楚长(zhang)(zhang)方(fang)形(xing)的(de)(de)木(mu)板(ban)有哪些属性,它只能从给定的(de)(de)一些木(mu)板(ban)图片中提取(qu)事物(wu)的(de)(de)共(gong)性如(ru)木(mu)板(ban)长(zhang)(zhang)度(du)相同,而这些共(gong)性不(bu)一定都是(shi)事物(wu)的(de)(de)属性。因此目(mu)前大部分AI模型都难(nan)以分清事物(wu)的(de)(de)属性特征。

二、通过“解耦”让AI理解事物属性

在该(gai)项目(mu)中,研究(jiu)人员试图使用“解耦”的概念来(lai)克(ke)服AI模型难以分清研究(jiu)对象不同(tong)属性的难题(ti)。

简单来(lai)说(shuo),解耦是指就是当你直(zhi)接替换事(shi)(shi)物的某个特性时(shi),对原来(lai)事(shi)(shi)物的理解不造成影响。

比如说,你有一(yi)台(tai)黑(hei)(hei)色(se)的(de)电(dian)脑,并且从未见过(guo)黑(hei)(hei)色(se)的(de)水杯,但是你知(zhi)道水杯是什(shen)么样的(de)。你会将从黑(hei)(hei)色(se)的(de)电(dian)脑上知(zhi)道什(shen)么是黑(hei)(hei)色(se)的(de), 然后将这个概念应用于(yu)水杯上,你就(jiu)知(zhi)道黑(hei)(hei)色(se)的(de)水杯是什(shen)么样的(de)。在这个过(guo)程中,你就(jiu)实现(xian)了“解耦”。

让AI拥有人类的“想象力”!深度神经网络新突破,或用于合成药物

▲来源:Tech Xplore

与传统算法一(yi)次(ci)只分析一(yi)个样本不同,AI学习(xi)拆解(jie)事物的(de)属性需(xu)要通过(guo)解(jie)耦技术分析一(yi)组(zu)样本图像,并挖掘它(ta)们之间的(de)相似性,实(shi)现(xian)“可(ke)控解(jie)开表征学习(xi)(controllable disentangled representation learning)”。然(ran)后,AI将重新(xin)组(zu)合这些属性信息(xi),以实(shi)现(xian)“可(ke)控的(de)新(xin)图像合成(controllable novel image synthesis)”,或者可(ke)以叫做(zuo)“想象力”。

葛云皓以(yi)(yi)变形金刚为例解释,“AI可以(yi)(yi)采用威震(zhen)天的(de)形状,大黄蜂的(de)外观和动作,以(yi)(yi)及纽约时代广场(chang)的(de)背景(jing)进(jin)行‘想象’。最终,即(ji)使在此前训练期(qi)间AI从(cong)未见过(guo)这个场(chang)景(jing),它也将呈现这样(yang)的(de)一幅画面:在时代广场(chang),黄色的(de)威震(zhen)天做着大黄蜂标准动作。”

这样的(de)想象方式(shi)有(you)点类似于人类的(de)推断行为,当人们(men)(men)看到(dao)一个物体的(de)颜(yan)(yan)色时,我们(men)(men)可以用(yong)新颜(yan)(yan)色替(ti)换(huan)原始颜(yan)(yan)色,并轻松(song)地将轻松(song)地推断这个颜(yan)(yan)色的(de)其他(ta)物体会是什么样的(de)。

解(jie)耦还可以应(ying)用(yong)于深度伪造技术(deepfakes)。例如,将(jiang)(jiang)人(ren)脸的运动和人(ren)的身(shen)份(fen)分开,AI模型可以将(jiang)(jiang)A的身(shen)份(fen)替换为(wei)B,但(dan)保留A的动作,合(he)成(cheng)新(xin)的图像和视频。

此外,在进行该项研(yan)究(jiu)时,该研(yan)究(jiu)团(tuan)队生成了一个(ge)156万张的图像数(shu)据集(dataset),可以帮助相关领域的研(yan)究(jiu)团(tuan)队开展研(yan)究(jiu)。

三、拆开后重组事物属性后,“解耦”可协助研发新药

虽然解耦(ou)并不是一(yi)个有关AI“想象力”的(de)(de)(de)新(xin)设想,但(dan)研究(jiu)人员表示,他们(men)的(de)(de)(de)设计框架可(ke)以让AI适应于大(da)多数的(de)(de)(de)数据(ju)和知识(shi)领(ling)域,这将扩大(da)AI“想象”的(de)(de)(de)应用范(fan)围。此外,AI还可(ke)以从(cong)相关信息中完(wan)全抹除种族、性别等容易造成歧视的(de)(de)(de)属性,让人们(men)的(de)(de)(de)信息在被数据(ju)分(fen)析(xi)时,得到相同的(de)(de)(de)处(chu)理(li)方式(shi)。

在医学领域,学会分(fen)辨(bian)属性的(de)(de)AI可以(yi)帮助医生和生物学家发现(xian)更多有(you)用的(de)(de)药(yao)物。AI将药(yao)物的(de)(de)功(gong)能(neng)与(yu)药(yao)物的(de)(de)其(qi)他(ta)特性分(fen)开,然后将不同药(yao)物的(de)(de)特性重新组合,以(yi)合成新药(yao)。

不仅如(ru)此(ci),当AI具有“想象力”后,它还可以(yi)帮助创(chuang)建(jian)更(geng)安全的人工智能。比如(ru)说,它让(rang)自动驾驶汽车“想象”如(ru)何避(bi)开训练(lian)中从(cong)未遇见的危险场(chang)景。

“深(shen)度学习(xi)在很(hen)多领域都(dou)展(zhan)示了(le)(le)较大的(de)前景,但这些往往通过让AI浅层模仿(shallow mimicry)人类行为发生的(de),这些技(ji)术并没有更深(shen)入地(di)了(le)(le)解(jie)每个研究对象独一无二的(de)属性特(te)征”,计算机科学教授(shou)Laurent Itti说,“第一次真正(zheng)地(di)释放了(le)(le)人工智能的(de)想象力,使它们能更加理(li)解(jie)人类是如(ru)何看待世界的(de)”。

结语:AI解耦或成“双刃剑”

南加州大学(xue)的(de)研(yan)究团队通过(guo)解耦技术,让(rang)AI能够(gou)分清事(shi)物(wu)的(de)不同属性。并且,AI可以(yi)将不同事(shi)物(wu)的(de)属性重(zhong)新组合(he),形成以(yi)前(qian)从(cong)未(wei)见(jian)过(guo)的(de)事(shi)物(wu)。该(gai)技术还可以(yi)让(rang)自动驾驶(shi)汽车避开从(cong)未(wei)遇(yu)见(jian)过(guo)的(de)危(wei)险(xian)前(qian)景(jing),以(yi)及协助合(he)成新药物(wu)。

当(dang)AI学会(hui)了如何(he)拆(chai)解(jie)(jie)事物(wu)(wu)的属性(xing)之后(hou),可以重新(xin)帮助人(ren)(ren)们(men)(men)了解(jie)(jie)事物(wu)(wu)的多样性(xing),提高人(ren)(ren)们(men)(men)对事物(wu)(wu)认知。但是当(dang)AI解(jie)(jie)耦(ou)应用于造假(jia)时,又将(jiang)给人(ren)(ren)们(men)(men)造成一定危害。AI解(jie)(jie)耦(ou)技术或(huo)成为一把“双(shuang)刃剑”,而人(ren)(ren)们(men)(men)在利(li)用AI技术优势时,如何(he)掌控(kong)好技术的“缰绳”,人(ren)(ren)们(men)(men)还(hai)将(jiang)继续探索。

来源:Tech Xplore