「自动驾驶新(xin)(xin)青年讲(jiang)(jiang)座」由智东西公开课(ke)企划(hua),致力于邀请全球知名高校、顶尖(jian)研(yan)究机构(gou)以(yi)及(ji)优秀企业的新(xin)(xin)青年,主讲(jiang)(jiang)在(zai)环境(jing)感知、精准定位、决策规(gui)划(hua)、控制(zhi)执(zhi)行等自动驾驶关键(jian)技术上的最新(xin)(xin)研(yan)究成果和开发(fa)实(shi)践。
「自动驾驶新青年讲座」目前已完结19讲,错过往期讲座直播的朋友,可以点击文章底部“阅读原文”进行回看!
有兴趣分享的朋友,可以与智东西公开课教(jiao)研团队进行邮件(jian)(class@k193.net)联(lian)系
正所谓,数(shu)(shu)据(ju)是推动(dong)自(zi)动(dong)驾(jia)驶(shi)的(de)原动(dong)力。自(zi)动(dong)驾(jia)驶(shi)汽车(AV) 需要大(da)量数(shu)(shu)据(ju)支持算法(fa)(fa)模(mo)型的(de)训练,使其能够(gou)适应各种驾(jia)驶(shi)场景(jing)和复杂(za)路(lu)况,提高系统的(de)鲁(lu)棒(bang)性和泛化(hua)性。而传统的(de)数(shu)(shu)据(ju)采集(ji)方法(fa)(fa)可能受限于实际道路(lu)条件(jian)和安全问(wen)题,无法(fa)(fa)获(huo)取到大(da)量多(duo)样化(hua)的(de)数(shu)(shu)据(ju)。在此(ci)过程中,生成(cheng)式(shi)AI技术(shu)展现(xian)出了巨大(da)的(de)潜力。
生成式(shi)AI能(neng)够生成肉眼无法(fa)分辨真假的(de)图像,结合自(zi)动驾(jia)(jia)驶(shi)模型训(xun)练的(de)数据(ju)需求,生成任(ren)何人类(lei)想象到(dao)的(de)驾(jia)(jia)驶(shi)场景。从而(er)为模型训(xun)练提供高质量(liang)合成数据(ju),破解自(zi)动驾(jia)(jia)驶(shi)数据(ju)和测(ce)试难题。
香港科技(ji)大学(xue)(广州)在(zai)读博(bo)士李乐恒(heng)等(deng)研(yan)究员尝试使用Generative NeRF生成(cheng)驾驶场景中的(de)自带标注的(de)训练数据,但(dan)发现以GIRAFFE(CVPR 2021 best paper)为代表的(de)NeRF无法生成(cheng)与标注相匹配(pei)的(de)多(duo)视图数据,从而阻碍了在(zai)下游(you)任务的(de)应(ying)用。
为解(jie)决这个问题,他们设计了一(yi)种2D-3D解(jie)耦的(de)(de)生(sheng)成框架(jia)Lift3D。先利(li)用2D GAN生(sheng)成带(dai)有姿态标(biao)注的(de)(de)多(duo)视(shi)图图像,再使用Conditional NeRF将其升维至3D,这样生(sheng)成的(de)(de)结果能同时具(ju)有逼真的(de)(de)纹理和多(duo)视(shi)图一(yi)致性(xing),证明了生(sheng)成式(shi)AI可以很大(da)程度地提高下游感(gan)知模型(xing)的(de)(de)性(xing)能。相关(guan)论文发表在(zai)CVPR 2023上。

8月(yue)14日(ri)晚7点,「自动驾驶(shi)新青(qing)年讲座」第20讲邀请到(dao)香港(gang)科(ke)技大学(广州)在读博士李乐恒(heng)参与,主(zhu)讲《生(sheng)成式AI应用于自动驾驶(shi)感知数据生(sheng)成的探索》。
讲者
李乐恒,香港科技大学(广州)在读博士。师从(cong)陈(chen)颖聪教(jiao)授,研(yan)究(jiu)方(fang)向包括计算机(ji)视觉和自动(dong)驾(jia)(jia)驶(shi),近期的研(yan)究(jiu)重心是生成(cheng)模型在自动(dong)驾(jia)(jia)驶(shi)的应(ying)用。曾以第一作(zuo)者(zhe)在CVPR上发(fa)表相关成(cheng)果,担任人工智能顶级(ji)会议AAAI等审稿人。曾在旷视科技、蔚(yu)来汽车进行科研(yan)实习。
第20讲
主 题
《生成式AI应(ying)用于自动驾(jia)驶(shi)感(gan)知数据(ju)生成的探索》
提 纲
1、基于(yu)GAN的(de)Generative NeRF研(yan)究
2、GIRAFFE在多视(shi)图数(shu)据生成上的问题
3、基(ji)于2D升维的生成管线(xian)Lift3D解(jie)析
4、自动驾驶感知(zhi)任务(wu)的实验(yan)结果(guo)对比
直 播 信 息
直播时间:8月14日(ri)晚19:00
直播地点(dian):智东西(xi)公开(kai)课知识(shi)店铺(pu)
成果
论文标题
《Lift3D: Synthesize 3D Training Databy Lifting 2D GAN to 3D Generative Radiance Field》
论文链接
//arxiv.org/pdf/2304.03526.pdf