特斯拉的人工智能野心

时间:2021-08-24 08:06       来源: www.kysm.net

(作者:彭苏平 编辑:何芳)

AI落地的野心与现实,显然还存在着不小的鸿沟。

特斯拉不止是一家汽车制造公司,而且是一家科技公司。上周的一场发布会,让特斯拉的这种形象愈加鲜明。

北京时间8月20日上午,预热多时的特斯拉人工智能日活动如期举行。特斯拉发布了FSD(完全自动驾驶)纯视觉解决方法、自研人工智能芯片和Dojo超级计算机,其披露的更多技术细则与有关硬件更为迅速的技术迭代,让业内第三惊叹“特斯拉的技术是真的非常牛”。

不过,对于长期关注特斯拉的人而言,无论是纯视觉解决方法还是自研人工智能芯片和Dojo超算,都算不上是“大新闻”,最让人吃惊的,事实上是一个“彩蛋”:特斯拉宣布马上推出类人机器人,也就是所谓的Tesla Bot。

对于AI技术,埃隆马斯克显然还有更远大的追求。8月21日,清华大学AI研究院视觉智能研究中心主任邓志东对21世纪经济报道记者表示,无论是FSD还是消费级的个人机器人,核心都是人工智能,而自动驾驶、个人机器人这两大应用场景,在将来经济社会进步中都具备颠覆性,也蕴含了巨大的产业进步空间。

不过,整体而言,目前AI在产业界的应用还不尽如人意。即使是特斯拉,它的自动驾驶技术尽管在业内已经比较领先,但仍然远未成熟,现在仅处于还需要人为监管的辅助驾驶阶段,最近,其辅助驾驶功能上的一些缺点更是引发了广泛关注。

AI落地的野心与现实,显然还存在着不小的鸿沟。

特斯拉人工智能技术体系的灵魂

“特斯拉的人工智能能力,其技术迭代之快,至少是现在全世界其他新、老车企所不拥有的。这为自动驾驶与个人机器人的应用落地与产业进步,提供了更大的预期。”邓志东对21世纪经济报道记者表示。

在人工智能日活动上,特斯拉向外面展示了其在人工智能范围的各项成就,包括纯视觉策略FSD的进展、神经互联网自动驾驶练习、D1芯片、Dojo超级计算机等等。其中一项重头戏便是纯视觉策略FSD的进展。

与业内绝大部分自动驾驶解决方法提供商的技术路线不同,特斯拉一直坚持纯视觉策略,通过摄像头进行环境感知,不需要激光雷达,也不需要高精地图。相对来讲,这种策略的硬件本钱相对较低,但对数据和算法的需要更高。

发布会上介绍的策略显示,特斯拉通过8个环绕全车身的摄像头获得道路周围信息,并通过多任务的神经互联网构造来拼接不一样的图像。为了让拼接出的信息更逼真、更有参考价值,特斯拉开发了一套技术,可以通过摄像头的信息绘制3D鸟瞰图,并形成4D的空间和时间标签的“路网”以呈现道路等信息,帮汽车更精准地把握驾驶环境。

上述过程,在自动驾驶中的专业术语是感知,而感知只是自动驾驶核心技术中的一项。有了大量数据基础之后,还需要打造一个强大的神经互联网,对这部分数据进行整理和重新剖析。

邓志东指出,对于神经互联网大模型,一般需要云数据、大算力的“暴力”支撑,在自动驾驶赛道,特斯拉基于众包的网络思维,以首创的影子模式获得了最大规模的真实道路交通云数据,而这次发布会也展示了特斯拉在自动驾驶仿真或数字孪生系统上的成就。

据介绍,特斯拉打造了一个1000人规模的数据标注团队,结合人工的细腻与机器的高效,对物体信息进行标注。同时特斯拉还开发了仿真场景技术,模拟日常不容易见到的“边缘场景”,来提高神经互联网的培训效率。

“这方面的工作不仅能够获得更大规模的合成数据,而且对基于深度强化学习的决策规划研究,对应用落地之前怎么办长尾问题、边缘小概率事件等,都具备特别要紧的意义。”邓志东表示。

伴随所需处置的数据开始呈指数级增长,特斯拉也在提升练习神经互联网的算力,因此,Dojo超级计算机诞生。事实上埃隆马斯克此前已经多次“剧透”过Dojo超级计算机的存在,这次人工智能日发布的,更引人注目的是组成Dojo超级计算机的重要单元——特斯拉自主研发的神经互联网练习芯片——D1。

早在2021年4月特斯拉就量产了自研的FSD芯片,这次展示的D1芯片,在构造与性能上都有了大幅度升级。据称,D1芯片使用分布式结构和7纳米工艺,搭载了500亿个晶体管、354个练习节点,仅内部的电路就长达17.7公里,达成了超强算力和超高带宽。

而Dojo超算,原来是由5760块英伟达的A100显卡构建,而目前则完全改成了自研,由3000 块D1 芯片或120个练习单元组成,总算力达到了9PFLOPs(9千万亿次),可以适应大量视频云数据,达成人工智能大模型练习。

埃隆马斯克曾表示,最后会将Dojo超算提供给期望用它来练习神经互联网的其他公司,这意味着,特斯拉大概将人工智能应用扩展到自动驾驶以外的其他范围,这次亮相的机器人便在一定量上证实了这个可能性。

据了解,Tesla Bot高1.72米,重56.6千克,脸上的屏幕可显示信息,拥有人类水平的双手,并有力反馈感应,可以达成平衡和敏捷的动作——它将借助Dojo超级计算机的练习机制来改进功能。

埃隆马斯克表示:“将来劳动力不会短缺,但体力劳动只不过一种选择。Tesla Bot可以实行一些危险性、重复性、枯燥的任务。”这个项目已经提上日程,根据计划,Tesla Bot或将在明年推出首个原型机。

邓志东指出,现在的人工智能,可以对产业赋能的实质就是具备学习力的数据智能,或者说大规模的神经互联网,从人工智能算法来看,特斯拉显然抓住了多摄像头视觉神经互联网这一核心构造,力图通过神经互联网固有些学习力,来解决自动驾驶甚至是个人机器人场景的所有问题。

“用自主学习来解决感知、预测与规控等挑战,可以充分发挥机器超越人类的能力,这是特斯拉人工智能技术体系的灵魂,也是特斯拉在理念上最领先的地方。”邓志东指出。

人工智能落地仍存挑战

此次“秀肌肉”,特斯拉的目的是为了招揽人工智能范围更多的专业人才。

尽管特斯拉是自动驾驶行业肯定意义上的“领头羊”,但其距离真的的无人驾驶也还有非常长一段距离,即使是目前已经落地的辅助驾驶功能,也并未做到尽善尽美。从这个角度看,人工智能技术进一步发挥用途还有待进一步健全。

最近,美国国家公路交通安全管理局(NHTSA)启动了对特斯拉的调查。据了解,NHTSA调查的11起事故均与特斯拉的AuTOPilot(自动辅助驾驶)或其他自动驾驶功能有关,其中,7起事故导致了职员伤亡,共计17人受伤和1人死亡。

具体而言,这部分事故发生在2021年1月22日至2021年7月十日之间,横跨九个不一样的州。它们大多发生在晚上,事故后的场景中都有一些诸如急救车灯、照明弹、发光箭头板和路锥等物体——从场景上看,在道路救援职员停下汽车推行救援任务的时候,特斯拉的自动辅助驾驶功能未能成功辨别到这部分物体和汽车,进而发生碰撞。

上汽集团技术中心的一位规控工程师在剖析该类事故缘由时指出,锥桶+静止异形汽车是个典型的边缘场景,单纯摄像头甚至是摄像头+毫米波雷达的传感器组合都非常难覆盖到这个场景。“第一,锥桶形状比较小,远距离下毫米波雷达非常难扫到,静止目的(包含汽车)则比较容易被过滤掉。而摄像头假如没针对的练习,没办法辨别出障碍物也会变成睁眼瞎。即便距离驶近后辨别到了汽车,也由于高速近距离而不可回避碰撞。”

坚持纯视觉策略的特斯拉,尽管已经部署了摄像头练习的策略,但显然到今天并未解决这个问题。对于特斯拉而言,这种功能上的缺点需要尽快处置,这势必需要其进一步壮大人工智能有关的团队,这次发布会详细地展示其技术路径与储备,特斯拉便是在向志同道合的行业人士抛出橄榄枝。

站在特斯拉的角度,企业的掌舵者埃隆马斯克目前展示了更大的野心。这次发布会上亮相的人形机器人显示,特斯拉不只要做一个拥有自动驾驶能力的智能汽车公司,而且要做一个覆盖更多面的AI机器人公司,这对特斯拉有关技术团队的搭建和储备提出了更高的需要。

从中观的视角来看,近年来,全球AI行业获得迅速进步,AI企业的数目和筹资水平高速增加,围绕AI产业的人才角逐已经愈发激烈。

亿欧智库的一份报告显示,在过去10年中,全球主要国家新增人工智能企业数目在2021年左右达到峰值,其中,中国和美国新增人工智能企业数目在2021年后绝对值仍然大幅度领先于其他国家,是全球人工智能企业领先区域;从引入资金的角度来看,全球人工智能企业筹资数目持续增长,在2021年将来呈现出几何级增长趋势,至2021年全球人工智能企业共计筹资784.8亿USD,其中美国居首。

而人工智能人才长期以来是紧急的供不应求状况。多个研究机构曾发出报告,全球各地人工智能工作岗位都存在巨大的缺口。据美国人工智能机器处置智能化技术研发商UIPath推出的《人工智能 Jobs》报告,美国在2021年有7465个有关职位空缺;加拿大Element 人工智能的首席实行官JF Gagne发布的2021全球人工智能人才报告也显示,全球人工智能人才库正在增长,但需要仍然超越供给,最新的2021全球人工智能人才报告则显示,尽管去年有关要求有肯定降低,但对于“新角色”的需要却一直稳定。

JF Gagne发布的最新报告指出,人才是人工智能进步的掣肘,而现阶段的人工智能行业需要的还不止是学会软件算法的人才。“人工智能的全部潜力是不是被过度炒作还有待讨论,但大家可以说, 人工智能真的获得成功不只需要高级专家与正确的数据算法。人工智能行业刚开始专注于特别高级的专家,由于只有他们才能管理新技术,并将其应用于新范围。但目前大家认识到,这项新技术需要的不止是工程师和可以构建好模型以有效部署它的职员。”

该报告进一步讲解,人工智能是新一代软件,它是用数据而不是逻辑规则编码的,相比之下,传统软件是静态的,人工智能则需要一个新的基础设施生态系统,不只要构建,还要在部署后进行治理,因此,为了让人工智能大规模发挥用途,工程、基础设施建设、新业务模式开发和目的监控等范围都需要很多的新人才。