独立思考,文火慢炖。
汽车行业的变革浪潮里,又来了一位「硬核」玩家——大疆。大疆于近日公布了「大疆车载」这一品牌,并将参加下周的上海车展。
别误会,并不是造无人机的大疆也要去造整车,而是以「大疆车载」的品牌,向汽车企业提供自动驾驶解决方案,做汽车行业的一级供应商(Tier1),辅助车企快速造出好用和用户买得起的自动驾驶汽车。
得知这个消息的时候,其实我并不惊讶。大疆虽然一直是全球无人机领域「最强王者」,但我 9 年前与其创始人汪滔认识的时候,他心里对大疆的定义就叫「智能机器人公司」。
我真正感到比较意外的是,大疆并未在前期大肆宣传,而是选择了「文火慢炖」的方式进入车载领域。从 2016 年开始,大疆在幕后闷了 5 年时间做研发,结果一「出关」,正赶上汽车智能化成为业界共识的时刻。
大疆车载领军人沈劭劼
最近,我认识了大疆车载领军人沈劭劼,他也是香港科技大学-大疆创新联合实验室负责人,在学术界和工业界都颇有研究。
通过与他详细的交流,我梳理出大疆在汽车领域的发展过程:2016 年底就开始投入自动驾驶研发,2018 年拿到自动驾驶测试牌照,2019 年开始与车企合作,推进自动驾驶技术的落地;2020 年已经确立了车载行业的软硬件系统,生产、质量等体系,甚至参与行业标准制定。只是这些都极其低调地在进行,相关成果也很少有人知道。
关于何时能够买到搭载大疆自动驾驶系统的量产车,沈劭劼没有说,但我猜应该不会很久。其实我觉得很有价值的是,他阐述了大疆在自动驾驶乃至汽车领域的一些更深的思考,值得写出来,与大家分享一下。
进入自动驾驶的逻辑是什么?虽然沈劭劼没有透露,但据我跟一些大疆内部人士了解到,大疆车载在正式与我们见面时,其实已经拿到了汽车行业里顶级公司的订单。
显然大疆并不是忽然之间拿出一套完整的技术方案。应该是 2016 年底,大疆就一直秘密研发自动驾驶相关技术。这个时间点也很有意思,当时大疆在无人机领域已经有了一个很高的成就,而自动驾驶却处于一个还没有完全火,但很多人都开始讨论的状态。
就像大疆对自己的定义是「智能机器人公司」一样。从这个思路出发,不管是无人机还是汽车,或者以后大疆可能会涉足的领域,其实都可以把它看作是智能机器人技术的应用。而从目前来看,自动驾驶被人称作「人工智能技术的皇冠」,行业本身也是巨大的蓝海市场,汪滔和沈劭劼在 2016 年,应该就是在这个思路上首先达成了共识。
在今天,自动驾驶已经很热,但在大疆刚开始研究汽车相关技术的时候,不论是技术还是供应链等方面,自动驾驶都存在着高度的不确定性。我很好奇的一个问题在于,是什么让大疆在当时树立信心,选择成为 Tier1,给车企提供自动驾驶整体解决方案,作为对未来的下注?
沈劭劼认为,自动驾驶的不确定性当然很多,直到现在也是如此,但大疆看到的,却是它的确定性。
本质上,自动驾驶存在着一套基本框架。行业中争论的最热的问题,都逃不开这套框架的几个维度。比如今天在自动驾驶行业里最受关注的摄像头视觉技术和激光雷达技术路线,使不使用高精地图,是否依赖路端感知等问题,根本上来说,都是广义上传感器维度上的设计思考;分布式架构还是集中式架构,基于 GPU、FPGA、专用算法加速 IP,还是其他异构平台,属于对算力和软硬件协同设计的分析;依赖深度学习技术,还是用基于模型的传统方法,是在算法软件层面的解构;而在具体落地形式上,到底是 Robotaxi 落地运营,还是像特斯拉一样用大规模量产的汽车,涉及到如何获取数据的考量。
传感器、算力、算法软件和数据,是这套框架中的四个维度,可以总结为智能机器人系统在技术上实现的「四座大山」。
在汽车之前,这几个维度上效率实现最高的产品,恐怕就是无人机。实际上,一架无人机的内部,在各方面都有复杂的条件约束,要在这么小的产品里实现距离感知、决策规划这些功能,又有严格的散热、成本,以及生产和供应链的考量。所以在汽车上,大疆基于自己的积累,把世界观和方法论都迁移到自动驾驶当中,在这样一个更广泛的场景里落地。
自动驾驶的噪音和本质大疆创始人汪滔为人低调,但是他在内部却有很鲜明的思维方式。比如定义问题本质的时候,他会问:什么是那些看似是共识的「噪音」?
和沈劭劼聊天的时候,他果然也提到了「噪音」的这个角度。他觉得唯技术论、唯宣传论和唯资金规模论是自动驾驶行业里最大的噪音。甚至那种把手机行业中「堆料」、「跑分」等方法在汽车行业重现的趋势,沈劭劼也并不认同。
所以到底什么是自动驾驶的本质问题呢?
我和他聊到了一个有意思的话题:在自动驾驶时代,我一直有一个期待,就是在我每天上下班 3 公里的固定路段,把通勤时间用自动驾驶解决掉。通勤的这 20 分钟是我工作的黄金时间,但现在没有一家自动驾驶公司能做到这样的程度,因为这样看似简单的消费期待,其实在技术上并不简单。
从这背后能看得出,消费者对自动驾驶技术的期待主要在于,「好用不好用」这样的主观感受。尽管目前自动驾驶也存在着从 L0 到 L5 这种严谨客观的技术分级制度,等级越高,责任归属逐渐从人转换到车。但这些级别从来没有定义过功能是什么,或者好不好用。
真正到达 L4 甚至 L5 当然是最完美的,但现实是这需要时间。即便靠技术堆叠和不怕出事故的勇气宣布实现了高级别自动驾驶,其成本依旧会很高,可靠性也还需要时间来验证。
L3 和 L4 显然是目前绝大部分新造车力量的共同目标,因为它已经有潜力重新定义车的体验。只不过很多企业在讲自己达到了 L3 甚至 L4 级别自动驾驶的时候,从用户体验上看,与消费者主观预期似乎还无法达成统一。这里面的核心问题是,如何定义用户在今天技术条件下「想实现且能实现」的到底是什么?
沈劭劼的观点是:如果把「好用的自动驾驶」定义成为用户在车内不用做任何驾驶动作,按一个键,到达目的地就下车。那么,即便在 L2+ 的技术分级上,也应该有更多的体验提升空间。
比如大疆的思路就是在自动驾驶过程中寻找更高的「可用范围连续性」,尽可能提供更多用户注意力解放,而不是去片面追求更高但是不可靠、或者不可普及的纯技术分级。
自动驾驶系统的可用范围,在行业内通常使用 ODD(Operational Design Domain,运行设计域)进行描述,ODD 的连续性对用户体验来讲十分重要。ODD 本身也存在很多个维度,需要选定时间和空间,之后必然还会有一定的概率出现各种例外的情况。如果例外情况多到系统无法保证足够的连续性,那系统在这个空间里本来就不应该用。因为要求用户时刻保持注意力,而不确定什么时候要接管和控制车辆,这样用户体验和安全性反而都会更差。
如果面对大部分时间自动驾驶系统都能够自行处理,但偶尔有一些例外情况,比如高速道路上出现了一些系统无法识别的障碍物等问题,如果解决了就会明显提升连续性。对应到技术路线里,就是如何在一个物体无法被识别出来的情况下,对它进行躲避动作。这个问题如果被「硬刚」突破掉,连续性就上来了。
从聚焦到连续性这个角度出发,可以推导出一系列新的技术要求。虽然例外情况发生的概率不可能彻底消除,但这样的突破,会大幅增加功能可用的连续性。
大疆在自动驾驶技术上的不同思考,如果让我总结的话,就是一方面是敢于「认怂」,也就是面对现实,不直接强行追求技术上的所谓高级别。同时,如果一些场景连续性很难实现,该让驾驶员主导的,就不要去输出很差的自动驾驶体验,应该提早明确「这些场景我不行,还是人来操控」。这比让人觉得车可以自动驾驶,但又要随时接管的体验和安全性都会更好。
而另一方面则是要「硬刚」,当车进入到可以追求自动驾驶连续性的场景中,大疆可以「硬刚」到那些最值得解决的细节当中去,聚焦且极致地提升连续性,让消费者在尽量多的场景里真正得到注意力的解放,这样才是消费者真正需要的自动驾驶体验。
大疆做自动驾驶这件事,给自己设定的「元问题」——是让每个人都有安全、轻松的出行。这句话看起来并不「高大上」,但它背后承载的安全性、功能体验,以及成本问题,都显然需要大疆有更好的均衡驾驭才能实现。这个目标也注定大疆的技术思路会有所不同。
「产学研」和「技工贸」虽然沈劭劼是在学术界比较有名气的人,但他一直认为自己是一名硬核的机器人工程师。学术界与工业界的融合,对他来说并不是矛盾,这反而带来很多的优势。其中一个优势就是在「产学研」转化非常快,许多学术研究的技术甚至不用转化,直接做出来就可以用在「实战」里面。
「如果往回看自己的学术研究,其实都是属于先从工业界找问题,再想最好的方法去解决问题这个思路去展开的。我们会说 AI 是拿着锤子找钉子,但我是反过来的,是拿着钉子找锤子。」沈劭劼表示。用最好的方法解决问题这个点很有意思,像沈劭劼这样的工程师一直在思考的是如何实现学术与工程之间的平衡。
举个例子,做自动驾驶的时候,假设路面是平的,技术上可以将问题难度大幅降低。那路面不平的时候应该怎么办?一种解决方案是打各种补丁,但是对于学术型工程研究来说,会想着怎么能不打补丁,仍然能够一次性地解决所有问题。
我觉得沈劭劼和大疆的创始人汪滔思维方式出奇的相似。特别是对于技术这件事的较真儿。
上世纪 90 年代,中国企业有探讨过走「贸工技」还是「技工贸」路线。在之前的文章里我讲过,前者先做生意,求规模求效率,以此实现一定的原始积累,然后开发新产品,最后再争取技术高地,找到更强的竞争力和壁垒。而后者希望先开发新技术、新产品,努力实现其带来的丰厚利润。
当年做技工贸可以说是不太现实的,因为它受到时代的约束,企业是产业的既定游戏规则的玩家的时候,只能走贸工技的路线,遵循规则,在别人创造的技术红利中分一小杯羹。
但在过去十年,中国从「贸工技」到「技工贸」转变的趋势正在出现,比如大疆在无人机领域就是行业的引领者与定义者,自己给自己造技术红利,这是典型的技工贸逻辑。
虽然以沈劭劼 30 出头的年纪,并没有经历过贸工技的年代,但他对技工贸确实也有自己的理解。比如他觉得技工贸并不是靠一两项技术和专利能够解决的问题,而是人的思维方式问题。
沈劭劼说,大疆当年也学习过很多已有技术,但最后都会走向自主创新,甚至是一个集群一个集群的搞出自己的原生技术。因为汪滔不管这是不是眼前的「最短路径」,而更愿意判断「长期看这是不是最正确的路径」。最终,这种原生技术体系的构建,成了一种组织内的思维共识。他觉得这也应该是新一代中国企业,以及 80、90 创业者们应该有的思维方式。而在大疆车载的人才招聘上,沈劭劼也十分注重在这个观念上的「志同道合」。
看了这么多基本趋同的自动驾驶逻辑,还有这么多猛火爆炒型的「新造车」,大疆这种不太一样的技术思维,以及过去 5 年「文火慢炖」型的玩法,让我挺期待。
因为,这确实「不一样,很大疆」。
本文作者:张鹏
本文首发于公众号极客鹏友说,转载请联系极客君微信geekparker