- Objective:
- Breadcrumb:
# 概念阐释
BEV+[[Transformer|transformer]]是[[自动驾驶]]在**感知**阶段所使用的算法架构。这种由神经网络主导的自动驾驶算法被称为**端到端**的算法架构。
- **BEV:** 鸟瞰图,通过多个摄像头获得全方位视角图像,再通过共享 2D 特征提取器对不同摄像头获取的画面进行重建、拼接,最终形成 3D 全局视角。传统摄像头只能收集 2D 图像,采用[[CNN 卷积神经网络]]、[[RNN 循环神经网络]]+IPM 架构实现 3D 图像,但这种方法常导致 3D 效果失真;
- **transformer** :一种[[深度学习 Deeplearning]]架构,重点在于它的自注意力机制来捕捉序列中不同元素的相关性。
# 实例
# 相关内容
# 参考资料