近日,Waymo宣布了一项重大研究成果——名为“端到端多模态自动驾驶模型”(EMMA)的新型自动驾驶系统。该模型依托谷歌的多模态大语言模型(MLLM)Gemini,旨在提升无人驾驶车辆在复杂环境中的导航和适应能力。
据Waymo介绍,传统的自动驾驶系统往往采用模块化的设计,每个模块负责特定的功能,如感知、映射、预测和规划等。然而,这种设计在扩展性和新环境适应性方面存在局限性。为了突破这些限制,Waymo引入了Gemini大语言模型,利用其丰富的世界知识和卓越的推理能力,打造了一个更加智能和灵活的自动驾驶系统。
尽管EMMA模型在理论上具有显著优势,但在实际应用中仍面临一些挑战。目前,由于计算开销过高,该模型无法整合来自激光雷达或雷达的3D传感器输入,只能处理有限数量的图像帧。此外,研究团队还指出,Gemini等MLLM模型可能会产生“幻觉”,这在无人驾驶汽车中是不容忽视的安全隐患。因此,在EMMA模型能够大规模部署之前,还需要进行更多的研究和测试。
以上就是Waymo发布新型自动驾驶模型EMMA,基于谷歌Gemini大语言模型的全部内容了,嗨牛网精心打造,旨在为您呈现一个满载精彩纷呈资讯的宝库,全球前沿资讯、深度剖析行业动态、汇聚热门话题与独特视角,力求为您带来一场场知识与娱乐并重的盛宴。
64.5 MB
点击查看79.2 MB
点击查看24.1 MB
点击查看16.7 MB
点击查看54.07MB
点击查看12.86MB
点击查看