特斯拉HW 4.0芯片准备量产,算力竞赛要升级? 原创

发布于 2022-11-22 19:11
浏览
0收藏

特斯拉的新一代自动驾驶芯片即将进入量产阶段,它会开启新一轮算力竞赛吗?

特斯拉HW 4.0芯片准备量产,算力竞赛要升级?-开源基础软件社区

近日,台湾媒体报道台积电已经拿下特斯拉的芯片大单,将以 4nm 或 5nm 工艺生产特斯拉 Hardware 4.0 自动驾驶芯片。这一消息说明特斯拉的新一代自动驾驶芯片已经完成了设计,开始准备量产。


在特斯拉的带动下,自动驾驶芯片的算力竞赛又要升级了吗?

自动驾驶芯片从合作到自研,马斯克摊牌了

特斯拉的智能驾驶功能经历了从 Autopilot 1.0 到 Autopilot 2.0、再到 FSD(Full-Self Driving)的迭代升级,其硬件系统也从 Hardware 1.0 逐步升级至 Hardware 3.0。


在 HW 1.0 时代,特斯拉采用了来自 Mobileye 的 EyeQ 系列芯片。Mobileye 的风格稳健,特斯拉则非常激进,两者对于自动驾驶的理念有很大的冲突。于是在2016年, Mobileye 主动宣布与特斯拉终止合作。


进入 HW 2.0 时代,特斯拉找到了英伟达作为 Mobileye 的替代,采用定制版的英伟达 Drive PX2 自动驾驶计算平台(由 1 颗 Tegra Parker 芯片和 1 颗 Pascal 架构 GPU 芯片构成)。后来又升级为 HW 2.5,增加了一颗 Tegra Parker 芯片。


不过,特斯拉的老板马斯克并不喜欢受制于人,他会想尽办法把核心技术掌握在自己手里。于是,在与英伟达合作的同时,他找来了芯片界的传奇大神Jim Keller,开始自研自动驾驶芯片。


HW 3.0 由特斯拉自主研发,它的另一个名字更加为人所熟知:FSD computer,完全自动驾驶计算平台。有了自研芯片之后,底气十足的马斯克光速翻脸,在HW 3.0的发布会上疯狂 diss 前合作伙伴英伟达,称英伟达的芯片算力低、功耗大。

特斯拉HW 4.0芯片准备量产,算力竞赛要升级?-开源基础软件社区

HW 3.0 为自动驾驶提供了强大的算力支持。和采用英伟达芯片的 HW 2.5 相比,HW 3.0的图像处理速度提升了21倍,成本降低了20%,代价仅仅是功耗从 57w 增加到了 72w。


在此之前,无法想象一家车企能够拥有如此强大的芯片设计能力。HW 3.0 彻底奠定了特斯拉在自动驾驶领域的领先地位,将特斯拉送上神坛。

算力竞赛:来自英伟达和高通的反击

备受羞辱的英伟达老板黄仁勋一边在 twitter 上与马斯克开战,一边筹划着反击。HW 3.0 发布几个月之后,英伟达推出了最新的 Orin 芯片,不论是单芯片算力还是计算平台算力都远超特斯拉 HW 3.0。

特斯拉HW 4.0芯片准备量产,算力竞赛要升级?-开源基础软件社区

英伟达 Orin 自动驾驶芯片

不过,英伟达只能过过嘴瘾,在这个时间点特斯拉 HW 3.0 已经量产装车了,而英伟达 Orin 还停留在 PPT 上,直到今年才出现在量产车上。


面临同样情况的还有高通。在 2020 年初,高通发布了 Snapdragon Ride 自动驾驶计算平台,其算力和能效比都碾压了特斯拉 HW 3.0。不过尴尬的是,高通的产品也是期货,要等到 2023 年才会量产。


除了英伟达和高通,国内的芯片厂商地平线、黑芝麻也发布了能够超越特斯拉 HW 3.0 的产品,不过他们也还没有进入量产装车的阶段。

特斯拉的领先秘诀:无视行业规则

特斯拉 HW 3.0 之所以能够取得领先,关键在于“快”。HW 3.0 在 2016 年初开始研发,2019 年 4 月发布,几个月之后就量产了。


而英伟达和高通的自动驾驶芯片发布之后,需要再等 2 年左右才能在量产车上体验到。


英伟达和高通是没有能力还是不着急?都不是,而是因为他们的客户都是车企,所以芯片要满足汽车行业的各项标准,需要经历长时间的测试、达到车规级的 ASIL-D 安全等级。

特斯拉HW 4.0芯片准备量产,算力竞赛要升级?-开源基础软件社区

在特斯拉的字典里,并不存在“车规级”


特斯拉特立独行,根本就无视传统汽车行业坚守的车规级标准,事事快人一步,自然就能步步领先。不过,特斯拉的这种做法也许会带来一定的安全隐患。

展望特斯拉HW 4.0:能否刷新算力上限?

目前,英伟达的 Orin 芯片已经投入量产,高通 Snapdragon Ride 也蓄势待发,特斯拉 HW 3.0 的算力优势已不复存在。为了保持领先,特斯拉 HW 4.0 确实应该露面了,现在开始准备的量产是非常合理的。


特斯拉 HW 4.0 会有多强大?我们先来看看它的竞争对手。


在今年9月,英伟达和高通前后脚发布了新一代车载计算芯片——英伟达 Thor 芯片和高通 Snapdragon Ride Flex 芯片。


它们不仅仅是自动驾驶芯片,而是真正的车载中央计算机,可以同时为智能驾驶、智能座舱、通信等能力提供计算支持。为了满足多任务的需求,它们的算力达到了恐怖的 2000 TOPS(特斯拉 HW 3.0 的算力为 144 TOPS)。

特斯拉HW 4.0芯片准备量产,算力竞赛要升级?-开源基础软件社区

英伟达的新一代汽车芯片算力飙升至 2000 TOPS


特斯拉 HW 4.0 会采用同样的设计思路和性能指标吗?


我不这么认为。


首先,在需求方面,特斯拉不需要 2000TOPS 这么高的算力。


此前业界普遍认为 500-1000TOPS 的算力足以支持 L5 级自动驾驶,而智能座舱的算力需求不到 100TOPS。即使以后算力需求会越来越大,特斯拉也用不了 2000 TOPS。我相信马斯克不会为了“算力第一”的虚名去给工程师下命令,他只会在发布会上怒喷同行根本不懂自动驾驶,只会堆砌算力。


其次,在成本控制方面,特斯拉目前不支持车载中央计算机。


特斯拉是一家很务实的企业,非常重视规模效应和成本控制。


特斯拉此前发布了用于训练自动驾驶算法的 Dojo 超级计算机,每个训练模块集成了 25颗全新研发的 D1 芯片,虽然性能先进,但是工艺复杂、产量较小,所以成本是非常高的。

特斯拉HW 4.0芯片准备量产,算力竞赛要升级?-开源基础软件社区

特斯拉 Dojo 超级计算机将有可能成为最强大的超级计算机。


它由成百上千个训练模块构成,每个训练模块集成了 25 个 D1 芯片。


基于成本的考虑,在 D1 芯片的基础上开发 HW 4.0 是很有可能的(恰好 D1 芯片和 HW 4.0 都是由台积电生产的)。实际上,这也是业界常见的做法,比如英伟达的 Orin 自动驾驶芯片和 A100 数据中心芯片都采用了安培架构。不过,这种方案恐怕就难以集成智能座舱芯片了。


另一方面,目前特斯拉的智能座舱芯片是来自 AMD 的 Ryzen,这款消费级的芯片性能强大,而且价格比较便宜。而特斯拉在 GPU 方面缺乏积累,去开发一款智能座舱芯片完全是费力不讨好。

结语

一款芯片从开发完成到投入量产,大概需要 6-9个 月的时间。台积电今年订单不饱和,所以 HW 4.0 的进度应该还会加快。在 2023 年的特斯拉 AI Day 上我们应该就能一睹 HW 4.0 的真容了,相信它会再一次震惊业界。 



更多精彩原创内容请关注微信公众号:智能车指北


特斯拉HW 4.0芯片准备量产,算力竞赛要升级?-开源基础软件社区

©著作权归作者所有,如需转载,请注明出处,否则将追究法律责任
分类
已于2022-11-22 19:11:11修改
收藏
回复
举报
回复
添加资源
添加资源将有机会获得更多曝光,你也可以直接关联已上传资源 去关联
    相关推荐