第684章 启发和颠覆 (第2/2页)
这个概念对他而言不算陌生,但从未在量产自动驾驶领域被认真讨论过。
它太新,也太“重”了。
“对,”陈默点头。
“它不关心前方障碍物是车、是人、是锥桶还是别的什么具体类别。
它只关心一个最本质的问题:车辆前方及周围的三维空间里,哪些体素(VOXel)被占用了?
是刚性占用(如墙壁)还是柔性占用(如灌木丛)?
是可穿越的还是不可穿越的?”
他一边说,一边拿起桌上的白板笔,转身在旁边的白板上快速勾勒起来。
寥寥几笔,画出一个粗糙的车辆前方视角,然后打上密集的三维网格。
“输入多视角摄像头图像,甚至融合低线束激光雷达的稀疏点云,通过一个精心设计的3D卷积神经网络,直接输出一个稠密的三维占用栅格图。
每一个小格子(体素)都有一个概率值,表示它被占据的可能性。
同时,还可以预测每个被占据体素的运动状态(速度向量)。”
陈默的笔尖在网格上移动:
“这样,无论前方是一个标准车辆,还是一堆怪异的建筑垃圾,甚至是一团浓雾(如果能部分穿透),系统都能感知到‘有东西占着这个空间,可能会动’。
避障是最核心的需求,知道‘有东西’且‘它怎么动’,往往比精确知道‘它是什么’更重要,尤其是在极端COrner CaSe下。
而且,这种表达天然适合后续的轨迹规划和碰撞检测,因为它直接描述了空间的占用情况。”
他放下笔,看向已经完全被吸引的李鹏飞和卞金麟:
“这或许能绕过传统目标检测对长尾类别识别的依赖,提升对异形障碍物的泛化能力。
当然,计算量巨大是现实挑战,需要算法创新和硬件加速的协同。
但方向,我认为值得探索。
鹏飞,你在诺基亚搞高精地图和SLAM,对空间建模理解很深,怎么看?”
李鹏飞深吸一口气,眼中闪烁着震撼和兴奋的光芒,仿佛被一道闪电劈开了思维的迷雾。
他紧紧盯着白板上那个简陋的网格图,大脑以前所未有的速度运转起来。
忽略物体类别,直指空间占用的本质。
这思路太颠覆了!简直是给感知领域开了另一扇窗。
他之前的研究一直纠结于如何提升目标检测的精度和鲁棒性,却从未想过可以换个角度,直接描述空间的“满”与“空”、“动”与“静”!
“陈总...您这想法...”李鹏飞的声音因为激动而微微发颤。
“太...太有启发性了!
它跳出了物体识别的框架,直指自动驾驶最核心的空间安全性问题!
对!异形障碍物、未知物体...
这些困扰业界多年的难题,在占用网络的框架下,可能被极大缓解。
计算量确实是座大山,但稀疏卷积、模型蒸馏、专用硬件...
这些都是可以攻克的路径!
我...我立刻组织感知团队进行预研和可行性验证。
这可能是解决BEV落地痛点的关键钥匙!”