特斯拉HW 4.0芯片准备量产,算力竞赛要升级? 原创
特斯拉的新一代自动驾驶芯片即将进入量产阶段,它会开启新一轮算力竞赛吗?
近日,台湾媒体报道台积电已经拿下特斯拉的芯片大单,将以 4nm 或 5nm 工艺生产特斯拉 Hardware 4.0 自动驾驶芯片。这一消息说明特斯拉的新一代自动驾驶芯片已经完成了设计,开始准备量产。
在特斯拉的带动下,自动驾驶芯片的算力竞赛又要升级了吗?
自动驾驶芯片从合作到自研,马斯克摊牌了
特斯拉的智能驾驶功能经历了从 Autopilot 1.0 到 Autopilot 2.0、再到 FSD(Full-Self Driving)的迭代升级,其硬件系统也从 Hardware 1.0 逐步升级至 Hardware 3.0。
在 HW 1.0 时代,特斯拉采用了来自 Mobileye 的 EyeQ 系列芯片。Mobileye 的风格稳健,特斯拉则非常激进,两者对于自动驾驶的理念有很大的冲突。于是在2016年, Mobileye 主动宣布与特斯拉终止合作。
进入 HW 2.0 时代,特斯拉找到了英伟达作为 Mobileye 的替代,采用定制版的英伟达 Drive PX2 自动驾驶计算平台(由 1 颗 Tegra Parker 芯片和 1 颗 Pascal 架构 GPU 芯片构成)。后来又升级为 HW 2.5,增加了一颗 Tegra Parker 芯片。
不过,特斯拉的老板马斯克并不喜欢受制于人,他会想尽办法把核心技术掌握在自己手里。于是,在与英伟达合作的同时,他找来了芯片界的传奇大神Jim Keller,开始自研自动驾驶芯片。
HW 3.0 由特斯拉自主研发,它的另一个名字更加为人所熟知:FSD computer,完全自动驾驶计算平台。有了自研芯片之后,底气十足的马斯克光速翻脸,在HW 3.0的发布会上疯狂 diss 前合作伙伴英伟达,称英伟达的芯片算力低、功耗大。
HW 3.0 为自动驾驶提供了强大的算力支持。和采用英伟达芯片的 HW 2.5 相比,HW 3.0的图像处理速度提升了21倍,成本降低了20%,代价仅仅是功耗从 57w 增加到了 72w。
在此之前,无法想象一家车企能够拥有如此强大的芯片设计能力。HW 3.0 彻底奠定了特斯拉在自动驾驶领域的领先地位,将特斯拉送上神坛。
算力竞赛:来自英伟达和高通的反击
备受羞辱的英伟达老板黄仁勋一边在 twitter 上与马斯克开战,一边筹划着反击。HW 3.0 发布几个月之后,英伟达推出了最新的 Orin 芯片,不论是单芯片算力还是计算平台算力都远超特斯拉 HW 3.0。
英伟达 Orin 自动驾驶芯片
不过,英伟达只能过过嘴瘾,在这个时间点特斯拉 HW 3.0 已经量产装车了,而英伟达 Orin 还停留在 PPT 上,直到今年才出现在量产车上。
面临同样情况的还有高通。在 2020 年初,高通发布了 Snapdragon Ride 自动驾驶计算平台,其算力和能效比都碾压了特斯拉 HW 3.0。不过尴尬的是,高通的产品也是期货,要等到 2023 年才会量产。
除了英伟达和高通,国内的芯片厂商地平线、黑芝麻也发布了能够超越特斯拉 HW 3.0 的产品,不过他们也还没有进入量产装车的阶段。
特斯拉的领先秘诀:无视行业规则
特斯拉 HW 3.0 之所以能够取得领先,关键在于“快”。HW 3.0 在 2016 年初开始研发,2019 年 4 月发布,几个月之后就量产了。
而英伟达和高通的自动驾驶芯片发布之后,需要再等 2 年左右才能在量产车上体验到。
英伟达和高通是没有能力还是不着急?都不是,而是因为他们的客户都是车企,所以芯片要满足汽车行业的各项标准,需要经历长时间的测试、达到车规级的 ASIL-D 安全等级。
在特斯拉的字典里,并不存在“车规级”
特斯拉特立独行,根本就无视传统汽车行业坚守的车规级标准,事事快人一步,自然就能步步领先。不过,特斯拉的这种做法也许会带来一定的安全隐患。
展望特斯拉HW 4.0:能否刷新算力上限?
目前,英伟达的 Orin 芯片已经投入量产,高通 Snapdragon Ride 也蓄势待发,特斯拉 HW 3.0 的算力优势已不复存在。为了保持领先,特斯拉 HW 4.0 确实应该露面了,现在开始准备的量产是非常合理的。
特斯拉 HW 4.0 会有多强大?我们先来看看它的竞争对手。
在今年9月,英伟达和高通前后脚发布了新一代车载计算芯片——英伟达 Thor 芯片和高通 Snapdragon Ride Flex 芯片。
它们不仅仅是自动驾驶芯片,而是真正的车载中央计算机,可以同时为智能驾驶、智能座舱、通信等能力提供计算支持。为了满足多任务的需求,它们的算力达到了恐怖的 2000 TOPS(特斯拉 HW 3.0 的算力为 144 TOPS)。
英伟达的新一代汽车芯片算力飙升至 2000 TOPS
特斯拉 HW 4.0 会采用同样的设计思路和性能指标吗?
我不这么认为。
首先,在需求方面,特斯拉不需要 2000TOPS 这么高的算力。
此前业界普遍认为 500-1000TOPS 的算力足以支持 L5 级自动驾驶,而智能座舱的算力需求不到 100TOPS。即使以后算力需求会越来越大,特斯拉也用不了 2000 TOPS。我相信马斯克不会为了“算力第一”的虚名去给工程师下命令,他只会在发布会上怒喷同行根本不懂自动驾驶,只会堆砌算力。
其次,在成本控制方面,特斯拉目前不支持车载中央计算机。
特斯拉是一家很务实的企业,非常重视规模效应和成本控制。
特斯拉此前发布了用于训练自动驾驶算法的 Dojo 超级计算机,每个训练模块集成了 25颗全新研发的 D1 芯片,虽然性能先进,但是工艺复杂、产量较小,所以成本是非常高的。
特斯拉 Dojo 超级计算机将有可能成为最强大的超级计算机。
它由成百上千个训练模块构成,每个训练模块集成了 25 个 D1 芯片。
基于成本的考虑,在 D1 芯片的基础上开发 HW 4.0 是很有可能的(恰好 D1 芯片和 HW 4.0 都是由台积电生产的)。实际上,这也是业界常见的做法,比如英伟达的 Orin 自动驾驶芯片和 A100 数据中心芯片都采用了安培架构。不过,这种方案恐怕就难以集成智能座舱芯片了。
另一方面,目前特斯拉的智能座舱芯片是来自 AMD 的 Ryzen,这款消费级的芯片性能强大,而且价格比较便宜。而特斯拉在 GPU 方面缺乏积累,去开发一款智能座舱芯片完全是费力不讨好。
结语
一款芯片从开发完成到投入量产,大概需要 6-9个 月的时间。台积电今年订单不饱和,所以 HW 4.0 的进度应该还会加快。在 2023 年的特斯拉 AI Day 上我们应该就能一睹 HW 4.0 的真容了,相信它会再一次震惊业界。
更多精彩原创内容请关注微信公众号:智能车指北