端(duan)到端(duan)自(zi)动(dong)驾(jia)驶是(shi)自(zi)动(dong)驾(jia)驶技术的重(zhong)要发展方向之一。而要实(shi)现(xian)端(duan)到端(duan)自(zi)动(dong)驾(jia)驶,离(li)不(bu)开高(gao)精度3D信(xin)息输(shu)入,因(yin)此如何实(shi)现(xian)高(gao)精度的3D感知(zhi)尤为(wei)关(guan)键。
从3D感(gan)知的实现技(ji)术路径(jing)来(lai)看,主(zhu)要包括稠密算法和稀(xi)疏(shu)算法两个(ge)范畴。
在(zai)稠(chou)密(mi)算法(fa)范(fan)畴,主(zhu)要通过(guo)点云转换(huan)、多视图立体(ti)(ti)视觉等方法(fa),来获取场景中(zhong)每一个(ge)点的(de)深度信息,从(cong)而更准确地描述场景中(zhong)的(de)物(wu)体(ti)(ti)。其(qi)中(zhong)最具代表(biao)性的(de)就是近两年非常火热的(de)BEV感知,其(qi)多传感器数(shu)据(ju)从(cong)图像空间(jian)到BEV空间(jian)的(de)转换(huan)过(guo)程,就是典型(xing)的(de)稠(chou)密(mi)特(te)征到稠(chou)密(mi)特(te)征的(de)重新排列组(zu)合(he)过(guo)程。目(mu)前,BEV已在(zai)业界得到广泛关(guan)注(zhu)以及应用(yong)部署(shu)。
稠密算(suan)(suan)法也面临着一些(xie)挑战(zhan),比如巨大的数据量,需要(yao)高效(xiao)的数据处理和存(cun)储方(fang)法来(lai)提高计(ji)(ji)算(suan)(suan)效(xiao)率,减少内存(cun)占用。此外,考虑到多传感器数据结构的复(fu)杂性(xing),需要(yao)高效(xiao)的计(ji)(ji)算(suan)(suan)方(fang)法和计(ji)(ji)算(suan)(suan)平(ping)台来(lai)提升处理速度,并满足实时(shi)性(xing)要(yao)求。而在大多数实际应用场景中,自动驾驶系统需要(yao)计(ji)(ji)算(suan)(suan)的目标在空间(jian)中通常呈(cheng)稀疏状态分布(bu),这也就意味着在稠密算(suan)(suan)法范畴中,大量的计(ji)(ji)算(suan)(suan)是被(bei)浪费了(le)的。
稀(xi)(xi)疏感知(zhi)算(suan)法通过减少Query数量以及降低(di)特征交(jiao)互量来加(jia)快计(ji)算(suan)速度并降低(di)存储需求,大大提高感知(zhi)模型的计(ji)算(suan)效率和系(xi)统性能(neng)。基(ji)于稀(xi)(xi)疏算(suan)法的感知(zhi)方(fang)案在2D到3D的转换效率和长距离感知(zhi)方(fang)面具(ju)有一(yi)定(ding)优势(shi),也(ye)是目前业界正在积极探索(suo)的方(fang)向。
近期(qi),地(di)平线发表了关于(yu)稀(xi)疏(shu)感知(zhi)方(fang)案的系列工(gong)作:Sparse4D v1 & v2,从Query构建方(fang)式、特征(zheng)采样方(fang)式、特征(zheng)融(rong)合(he)方(fang)式、时序融(rong)合(he)方(fang)式等(deng)多个方(fang)面(mian)提(ti)升模型感知(zhi)效果。Sparse4D在nuScenes检测任务上达到了SOTA的效果,超过了VideoBEV、SOLOFusion和StreamPETR等(deng)算法的指标。
为了让大家进一步了解Sparse4D,10月18日19点,地平线联合智猩猩策划推出新一期地平线「你好,开发者」自动驾驶技术专场,主题为《面向端到端自动驾驶的稀疏感知通用架构探索》,由地平线感知算法工程师林天威主讲。
林天(tian)威首(shou)先会介(jie)绍3D感知的研究背景和(he)发展现状,并对稀(xi)疏(shu)(shu)通用感知架构进行解析。之(zhi)后(hou),林天(tian)威将重(zhong)点介(jie)绍和(he)讲解长时序稀(xi)疏(shu)(shu)化3D目(mu)标检测算法Sparse4D v1 & v2相关工作。最(zui)后(hou)他会分享稀(xi)疏(shu)(shu)感知新范式的未来探索方(fang)向。

专场内容
主题:面向端到端自动驾驶的稀疏感知通用架构探索
提纲:
1、3D感知研究背景与现状
2、稀疏通用感知架构解析
3、长时序稀疏化3D目标检测算法Sparse4D v1 & v2
4、稀疏感知新范式的未(wei)来探索(suo)方(fang)向(xiang)
主讲人
林天威,地(di)平线感知(zhi)算法工程师(shi),主要研究(jiu)领域包括端到端自(zi)动驾(jia)驶、生成模型、视(shi)频时(shi)序理(li)解等;在CVPR、ICCV、ECCV、AAAI、TPAMI等会(hui)议期刊上发表论文二十(shi)余篇,引用达2500余次。
课程信息
直播时间:10月18日19:00
直播地点(dian):智猩(xing)猩(xing)直播间