当前位置:首页>滚动 > >正文

毫末智行艾锐谈自动驾驶大模型:全新范式是「生存」必选项

  • 2023-08-07 13:57:40来源:机器之心
作者 / 曹锦
今年3月,OpenAI发布了多模态预训练大模型GPT-4,其带来的飞跃式表现在AI行业内外掀起了轩然大波。 在近一个月后,毫末智行(以下简称「毫末」)趁势推出了DriveGPT雪湖·海若,由于其概念定义、技术难度,应用挑战等问题,此次发布引发了许多讨论。

对此,毫末智行技术副总裁艾锐直言:「相不相信都没关系,关键要看持续的效果。」

针对大模型的热潮和DriveGPT的意义,「首席智行官」于近日对艾锐进行了一场对话,对其中问题进行释疑和解析。

DriveGPT并非临时起意


(相关资料图)

早在ChatGPT大火之前,毫末就一直在建设认知大模型。也就是说,毫末已经认识到当时技术路线的短板,并笃定自动驾驶需要一套全新的技术范式。

「面对一些认知层面的难题,我们先尝试运用了一些简单的Transformer模型来求解决策问题,但效果未达预期。」艾锐说道。

例如,毫末曾利用标准的监督学习方式,直接拟合人的驾驶轨迹进行训练。但后来发现,该方式虽然也产生了一些成果,但可行的场景受限,长久来看很难得到大范围扩展,天花板较低。

「而当ChatGPT出现后,我们从底层技术的角度仔细研究了它对自然语言问题的解法,然后发现其技术架构,实际上和自动驾驶认知要解决的问题非常像,于是便决定采用这条路径。」

作为一家每季度都要举办AI DAY的公司来说,毫末智行可以说是迭代速度内卷的代表之一。从「雪湖」到「五个大模型」再到DriveGPT,毫末的每次AI DAY几乎都不是「凑数」的,而且一直有较大的升级。艾锐称,这是因为,在自动驾驶进入洗牌期时,「不提前做起来,可能就会完蛋。

「你跟不上(新的思路),不代表别人跟不上,一旦有人能跟上,整个故事就不一样了。」艾锐认为,不能把宝押在「假设所有人都做不出来」。虽然他不敢说DriveGPT是最终解,但显然不能干等着别人验证成功。

「如果不提前做足准备,一心想等别人的成功案例,对不起,那你两年之后未必还能活着。」

自动驾驶与「生成式预训练」

虽然如今大模型来势汹涌,但究竟如何定义大模型,国际上仍无定论。而对于艾锐来说,大模型的核心能力,就是要拥有足够高的「数据规模-基础能力」转换效率,这也是其战略意义。「目前有些专家也认为,其实包括ChatGPT在内的大模型,距离通用人工智能还很远。但是从毫末的角度来说,我们追求的就是能实现质变的方法,并且要匹配战略优势,这是我们新路线最关键的一点。」

艾锐介绍称,DriveGPT是一种标准的生成式预训练操作方式,与此前毫末的五个大模型相比,是两种完全不同的路径。它不仅能将五个大模型的功能融合在一起,还使训练效率得到跃升。

据了解,DriveGPT采用decoder only的transformer结构、通过生成式(GPT)进行预训练,首先使用海量老司机的驾驶行为进行预训练,再引入司机接管数据和人工标注数据进行强化学习,筛选最佳驾驶决策。

从功能上看,这套方法能够根据10秒内获得的图片,预测生成未来2-3秒后的车辆感知结果,例如周边车辆的变道、行人的下一步动作等等。在生成这些结果的同时,也能够提供驾驶决策。

此前毫末数据智能科学家贺翔提过:「在开车时,周围的环境无时无刻不在变化。当人在开车时,不是基于过去的情况来做驾驶决策的,而是要基于以前的经验,来实时预测下一秒钟可能出现的情况,这种预判就叫做生成。」

同时,DriveGPT也需要以海量的数据进行预训练,这相当于有数万个司机,在用他们的驾驶行为来训练机器如何生成驾驶策略。

对于艾锐来说,数据最重要的标签是「分布」——「不是说总量多就行,最关键的是什么你都得有。」

在这一点上,他认为,AI在很多领域上的逻辑实际上是一致的。比如有人为了「净化」数据,曾将语料库中一些价值取向不好的文字和语料都删掉了,结果训练出来的语言模型整体效果反而下降了「这对自动驾驶也是一样,如果数据分布不全,那系统对世界的认识就是有缺陷的。

「大模型上车」

需要整个行业发展成熟

虽然毫末在新的技术范式上要争分夺秒地进行验证,但有些理想化的长远目标,却还需要观望——例如,大模型上车。

这既不是短期内可以规划的目标,也不是一家公司能够推进的事情。「现在,各种大模型,都不太可能直接上车。」艾锐直言,现在业界也有人在尝试大模型上车,但差得还比较远。

这其中最大的阻碍,就是算力需求——大模型往往需要上千块GPU进行训练,推理成本也非常高,数十亿甚至上千亿参数在车端是不可能实现的。

毫末曾经提出,从训练大模型的角度,传统的数据存在90%以上简易、重复的场景数据,从辅助驾驶的应用角度来看,后期或许可以减少这部分数据,而采集更多的高价值数据,以此降低训练成本

但即便如此,也仅仅是节省了云端成本,还是没办法上车。大模型上车首先需要在保持模型效果的前提下大幅度降低参数规模,同时也需要在芯片设计上做大胆创新,提升芯片运行大模型的计算效率、并降低芯片成本。

「现在车上的模型容量,与大模型容量相差至少四个数量级,所以必须要缩小一千倍,才有可能直接上车。」艾锐说道。

虽然毫末也被传出在与一些芯片公司在合作,但目的并非是大模型上车,而是提升自身自动驾驶产品的性价比。「现在大部分的芯片对Transformer的小模型支持得都不够好,就更别说支持大模型了。」艾锐认为现在谈大模型上车为时尚早。

目前,毫末的做法是,用一个大模型去训练真正上车的小模型。

「大模型相当于可以了解任何事情,如果再用小模型去拟合它,就像是老师带着一个学生,这会比直接从原始数据中去训练更简单,因为它模型的很多参数可以被直接借鉴。」艾锐介绍道。

同时他也认为,类似矿山,园区等低速领域的自动驾驶,对实时性要求较低,即便大模型不上车,也可以从云端直接控制这些车辆,这会产生巨大的变化。目前,毫末针对其物流配送小车,就在做类似的研究。

总体看来,大模型上车的解法和时间仍是未知,艾锐预测或许在3-5年后可以实现,但这需要整个行业的发展成熟,而不是由某一家企业单打独斗。

我认为现在最重要的,是把大模型搞好。因为它本身还未达到我们预期的状态,更没法想『上车』的问题。目前还有很多人在研究大模型的工程优化,大家可以分头行事。」艾锐认为,大模型上车虽然很难,但一旦做成了收益极高,而高收益的事情就总会有人尝试。

城市NOH与重感知技术

关于已开始在北京、上海,保定三地运行的城市NOH,艾锐提供了两条思路,首先,毫末想给用户更大的可用范围,而非局部路线;其次,在重感知路线中,将会只使用SD地图——「预计我们内部在今年年底就会使用SD地图,但要推送得看测试情况。

而毫末的重感知技术,同样是利用大模型来推进。对此,艾锐还是做了个拟人的比喻:「如果你只有一个导航地图,那就意味着你需要理解眼前的世界。因此,模型也需要像人一样,它需要理解中国的复杂道路。」

他表示,既然之前通过地图已经得到了拓扑结构,现在就需要去总结知识。「反向来说,就像你自己修了那些路一样,你得知道路是怎么修的,为什么修成那样,才能仅凭传感器数据就能推测出来后面道路的走向,这仅仅依靠小模型是做不好的。」

如今,毫末在DriveGPT上付出了极大成本,但其产品面对的主要市场还是20万元左右的中低端车型。对此,艾锐解释称,在顾及商业化考虑时,既要盯着眼下,也要兼顾未来。确实在简单场景中,不使用DriveGPT也可以保证效果。但是竞争的路很远,毫末的打法是,宁可先付出一些技术成本,但要保证方法可以扩展,走到最后的。

「我们每次在AI Day上都会放出最新的进展效果,有没有用,大家届时就能看到。」他说道。

关于首席智行官
「首席智行官」为机器之心推出的智慧出行垂直媒体,我们时刻关注业内动态及权威专家最新观点,不定期深度访谈业界代表人物,内容涉及自动驾驶、新能源、芯片、软件、汽车制造和智能交通等方向的前沿研究与技术应用,透过权威思路以洞察产品、公司和行业,帮助汽车领域专业从业者和相关用户了解技术发展与产业趋势。

标签:

延伸阅读

推荐阅读

毫末智行艾锐谈自动驾驶大模型:全新范式是「生存」必选项

作者 曹锦今年3月,OpenAI发布了多模态预训练大模型GPT-4,其带来的飞

“星闪”技术亮相华为开发者大会,余承东评价绝对遥遥领先

据了解,星闪技术汇聚了国内外300多家头部企业和机构的集体智慧,用一

上半年同比增长16.37%——黄金消费缘何回升向好

原标题:上半年同比增长16 37%——(引题)黄金消费缘何回升向好(主题

叙利亚首都附近遭以军空袭致4人死亡

据叙利亚阿拉伯通讯社7日报道,以色列军队当天凌晨对叙首都大马士革附

黑龙江省国资委召开全省地方国有企业2023年上半年经济运行分析会

黑龙江省国资委召开全省地方国有企业2023年上半年经济运行分析会,国资

地震瞬间男子跑一半转身冲回去接老婆

8月6日,山东德州。李先生门店外的监控拍到地震瞬间,李先生跑出一段距

历史性时刻!银行理财首度被公募基金反超,存续规模降至25万亿

历史性时刻!银行理财首度被公募基金反超,存续规模降至25万亿,固收类,

鸡内金是调理脾胃的吗

鸡内金是调理脾胃的药物,还有固精止遗、通淋化石的作用。鸡内金是用鸡

因地制宜 持续探索(科技视点·跟随科研人员去治沙④)

从乌鲁木齐出发,走乌奎高速—呼克公路—甘莫公路,一路向北,3个多小

初级会计职称是助理会计师吗(初级会计职称)

1、会计资格考试全国统一,必须考试。2、会计职称每年的合格率初级30%

8月,南京有这些演出!

2023南京戏剧节多部剧目多场脱口秀演出各式主题展览……8月文艺月历来

安宁产业园区抓项目建设增强发展后劲

本报讯记者缪亚平报道近日,安宁产业园区组织召开云天化450万吨磷矿浮

石家庄科技信息学院(关于石家庄科技信息学院的基本详情介绍)

大家好我是小蝌蚪,石家庄科技信息学院,关于石家庄科技信息学院的基本

墙面乳胶漆施工流程及注意细节(墙面乳胶漆施工工艺)

面乳胶漆施工流程及注意细节,墙面乳胶漆施工工艺这个问题很多朋友还不

怎么从电脑下载歌曲视频到u盘_怎么从电脑下载歌曲到u盘

从电脑下载歌曲到u盘的方法如下:1 插上u盘,将歌曲存储在d盘的KuGou文

草原(外一首)

深邃的夜空像一件珍珠衫星星闪烁着调皮的眼睛草原的皮肤是绿色的有生命

荣耀畅玩20 Pro保修期查看方法

1 方法一1、打开手机的,设置;2 方法一2、向下滑到,机;3 方法一3、

天津市发布大清河洪水红色预警

8月6日17时,独流减河进洪闸下泄流量582立方米 秒,大清河第六堡水位4

有望2024年初发布 新款宝马4系Gran Coupe谍照曝光 外形小

日前,外媒曝光了一组新款宝马4系(参数|询价)GranCoupe的谍照,新车是

物资调拨快、发放快 记者探访中央援助天津物资仓库

目前,天津市有6个区受到此次洪水影响,已累计紧急转移安置8万余人

稳就业促就业|贵州:数字经济发展带动大学生就业

贵州省是我国首个国家级大数据综合试验区,不少大数据企业在这里落地,

生活提示:触电时该如何急救

夏季高热潮湿,是一年中触电的高发期。那么,如果身边的人不幸触电,该

山东连夜蒸1万个馒头驰援河北 具体是什么情况!

【山东连夜蒸1万个馒头驰援河北】!!!今天受到全网的关注度非常高,那么

詹俊:曼城强留贝尔纳多-席尔瓦 新赛季重用阿尔瓦雷斯

新赛季英超最大的悬念就是:曼城能否实现史无前例的联赛四连冠?

国家减灾委、应急管理部派出工作组赴吉林指导做好救灾工作

记者8月6日从应急管理部获悉,国家减灾委、应急管理部5日针对吉林严重

造梦西游3玄武墓场 造梦西游3水下迷宫隐藏副本玄武墓场

0471房产来为大家解答以上的问题。造梦西游3玄武墓场,造梦西游3水下迷

《异人之下》首播大爆,两人被夸,三人被骂,一人未登场先封神

在空降这件事情上,谁还能做得比酷厂绝。大早上的把《异人之下》抬了上

因地震破坏燃气管网,山东平原紧急停气

8月6日凌晨,平原县融媒体中心发布紧急停气通知:本次地震对全县部分燃

奥纳纳属于什么档次 英媒:奥纳纳被吊门不是他的错 基本情况讲解

1、奥纳纳属于什么档次2、英媒:奥纳纳被吊门不是他的错3、以上就是关

途安自动挡变速箱油多久需更换油底壳(途安自动挡变速箱油多久需更换?)

途安自动挡变速箱油6万公里需更换,变速箱油更换方法有:重力更换:利

猜您喜欢

Copyright ©  2015-2023 今日服装网版权所有  备案号:沪ICP备2023005074号-40   联系邮箱:5 85 59 73 @qq.com