这届特斯拉AI DAY平平无奇?
波士顿动力的机器人都跑酷、跳舞了,特斯拉的擎天柱刚开始颤颤巍巍地浇花;FSD Beta版从一个停车场导航到另一个停车场的城市内“点到点”能力,小鹏和华为已在九月底开始小批量的给用户推送了;不设限的Dojo就算是干掉英伟达了?!
只有0.001%的人能看懂的特斯拉AI DAY从展示的结果上来看,似乎有些平平无奇?
硬核的知识还需要行家来解构。
10月9日,《电动汽车观察家》特邀“十万分之一大脑”:地平线BPU算法负责人罗恒博士;均胜电子副总裁、均胜智能汽车技术研究院院长郭继舜博士,带你重看2022特斯拉AI DAY。
解析硬核知识点、透视技术背后的企业逻辑、讨论你所关心的行业热点。
本文将剧透一二,如您对本次特斯拉AI DAY有任何问题希望与专家讨论,可在文后评论区留言,亦可在直播当天与专家在线互动。
01
特斯拉的擎天柱“弱爆了”?
虽然是屈髋抬膝,小碎步挪出来的,但特斯拉的擎天柱已经是个“打工人”了。据悉,擎天柱已在特斯拉弗里蒙特工厂中投入简单工作,工厂中有为其规划的行动路线。
北京时间10月1日,Tesla Bot人形机器人“Optimus”(擎天柱)原型机迎来全球首秀。原型机没有外壳,直接讲关节、骨骼、电缆等内部构造呈现出来,直观展示各个动作细节。
在现场,Optimus第一次在无人操作的情况下自主行走;
视频中,Optimus进行了提壶浇花、搬箱子、拿铝条、主动避让周围人员等动作。
特斯拉创世人马斯克表示:“我们的产量应该可以达到数百万台,预计它的价格比汽车便宜得多,预估机器人最终价格将达到2万美元以下。”他还预测,3-5年间Optimus即可量产上市。
马斯克对擎天柱的功能定位为“它能做人们不想做的枯燥、危险、重复性的工作。”
从目前展示的功能来看,特斯拉的擎天柱离人们理想中的机器人还相去甚远。波士顿动力的双足机器人Atlas的行进速度可达1.5米/秒,能跑酷、跳舞;擎天柱在配置牵引绳的基础上,可以完成行走、上楼梯、下蹲、拿取物体等动作。
这是否意味着擎天柱弱爆了?
罗恒表示,这次擎天柱只是对特斯拉机器人基本架构设计的初级展示,未来即使是架构也还可能会有几次迭代。但值得注意的是,创新是在真正的应用中产生的。而擎天柱是为量产而生的机器人,这也是特斯拉和其它机器人公司的区别。
事实上,如果从大规模量产,用以替代人类从事枯燥、危险、重复性的劳动,这一具体的应用场景来看,擎天柱分布式的执行器、仿生学关节和肌腱、对FSD神经网络的复用、对特斯拉汽车电池、安全模拟分析能力的复用,就变得非常有想象力。
“特斯拉不想做全世界最厉害的技术,只想做最厉害的产品。”郭继舜这样评价擎天柱。
02
“自动驾驶”到底能不能实现?
马斯克一遍一遍承诺完全自动驾驶就要落地了,不能实现FSD的特斯拉啥也不是;小鹏、理想也都立下了实现完全自动驾驶的时间表;华为更是在近日向深圳的极狐用户推送了城市领航功能。
作为行业观察者,已经等自动驾驶等得有些不耐烦了。
罗博和郭博不约而同地向我们表示,自动驾驶离我们越来越近了。
虽然没有去年transformer算法模型和BEV框架在自动驾驶实际应用给业内带来的震撼强烈,但今年特斯拉展示应用NLP(自然语言学习模型)的思想,优化现有的模型的方法,在提升车辆城市内的自动驾驶表现方面意义重大。
罗恒表示,今年FSD beta最大的一个改进就是在应对各种复杂路口变道。这应该主要来自于这个车道线网络。特斯拉实际上设计了一个面向车道线的语言模型。车道线由点和连接线组成,点可以分为“开始”、“继续”、“分叉”等等。
此外,自动标注从去年的概念方法论落地到了今年实际的系统,输出输入、中间用的特征都讲得明明白白。
从结果来看,一年中,FSD Beta测试版一年来的参与人数已增长80倍达到16万辆车,每天的数据集收集量达到10-50万个。而通过自动标注技术,特斯拉将训练场景的标注速度提升了1000倍。
此外,特斯拉虚拟仿真、数据闭环训练,以及Dojo超算中心等基础设施的建设到位,都将进一步推动其FSD能力的全面落地。
“特斯拉的方案自动化程度(已经变成主要依赖自动化数据标注)、效率(标注、模拟器)都在迅速提升,意味着更快地收敛物理世界的corner case,自动驾驶越来越近了。”罗恒表示。
那么,激光雷达还是必须吗?同样身处自动驾驶赛道上的中国玩家前景如何?
03
Dojo能干掉英伟达吗?
Dojo是特斯拉自动驾驶能力的核心基建。
2023年一季度,特斯拉将布置第一批10个Dojo超级计算机机柜,即算力超过1.1EFLOPS的ExaPOD,将自动标注能力提升2.5倍;未来,特斯拉共将在帕罗奥图布置7个这样的集群。
如果从机柜单纯的算力性能来看,Dojo还不足与英伟达一战。
3月英伟达发布超级计算机Eos由18个DGX POD机柜组成,AI计算性能高达18.4EFLOPS;对于传统的科学计算,Eos有望提供275 PFLOPS的性能。
但如果从自动驾驶的需求出发,两者就是另一番高下之分。
特斯拉这样描述它的Dojo:只使用一个由25个D1芯片组成的训练模块,就能实现6个GPU Boxes的性能,且成本低于一个GPU Box;只需要4个Dojo超级计算机机柜的算力,就能实现72个GPU机柜的自动标注性能。
Dojo超级计算机投入使用后,特斯拉在代码、设计方面已经实现了30%的训练速度提升,如通过自动标注技术,特斯拉将训练场景的标注速度大幅提升,相比人工操作提升了数周甚至数月的时间。
特斯拉在自动驾驶的战场,打赢了英伟达数据中心的仗吗?
在高效的神经网络训练下,特斯拉FSD软件在技术层面已经逐渐趋于成熟。马斯克表示:“目前FSD软件已经可以适用于全球各个地区的路况,如果地方监管政策允许,我们可以在今年年底面向全球推出FSD Beta版本软件。”
人形机器人、自动驾驶汽车,真的不远了吗?
中国汽车产业能否复制特斯拉?中国汽车产业是否需要复制特斯拉呢?
10月9日,我们细聊!