易车讯 8月20日自动驾驶机器人,2021特斯拉AI日(AI Day)开幕自动驾驶机器人,特斯拉发布自动驾驶机器人了旗下结合了AI(人工智能)技术,也就是基于视觉神经网络神经系统预测能力的自动驾驶技术,具有极强算力的DOJO D1超级计算机芯片,甚至还提到了2022年推出人形机器人的可能,这些都是特斯拉目前基于人工智能技术,针对自动驾驶等领域深度研发的最新软硬件技术。
特斯拉高层技术管理人员团队
在2021特斯拉AI日(AI Day)活动上,特斯拉CEO马斯克也现身活动现场,并表示特斯拉并非一家单纯的纯电动车制造公司,更是一家拥有深度AI(人工智能)技术的高科技创新公司。对于旁观者而言,创新和硬核科技才是是特斯拉竞争力的核心所在。
其实说白了,在AI日上,特斯拉想表明的主题是,通过针对人工智能技术的深度研发,未来特斯拉在理论上,将有能力提供更多具有高级人工智能的科技设备,也就是提供更多可以向人一样“聪明”的设备。
大家知道机器人是一个笼统的概念,包括智能手机、电动车、人形机器人等相关设备都可以被称为机器人。因此,再次简单解释一下,针对高级人工智能技术的深入研发,特斯拉在未来的制造领域,会拥有众多的可能,也许并非只是一家单纯的汽车制造商。
● 人工智能技术增强特斯拉电动车自动驾驶能力
首先是关于视觉神经网络技术的介绍,也就是通过摄像头让电脑识别真实世界物体的能力,通过“HydraNets”的多任务学习能力,现在特斯拉的自动驾驶技术可以实时的绘制有效的地图,比如自动使出停车场来到车主的身边,也就是大家熟知的自动召唤功能。
Autopilot软件主管Ashok Elluswamy还介绍了自动驾驶技术,通过“混合规划系统”解决方案,特斯拉电动车可以做到同时兼顾自身的驾驶,以及兼顾到其他汽车的驾驶,比如狭窄道路的双向会车,同时为自身和对方让路,像人类一样主动规划路径的能力。
另外,Ashok Elluswamy还介绍了特斯拉的自动标记技术,正是因为该技术可以更加准确快速的标记道路上的物体,因此特斯拉才可以提供摆脱毫米波雷达硬件方案的Autopilot技术。
特斯拉摆脱毫米波雷达硬件,但是通过基于人工智能技术的视觉神经网略解决方案,实现自动驾驶这个选择,到今天还在自动驾驶技术和汽车安全领域,存在着巨大的争议。
目前,在没有实际的硬件对比测试前提下,我们还很难做出评论,但是能确定的是,当前为数众多的主流自动驾驶技术厂商都在将摄像头、毫米波雷达、激光雷达、软件技术和高算力处理器作为最稳妥的解决方案。
● DOJO计算机理论上性能无限
接下来,Autopilot工程主管Milan Kovac展示了DOJO D1芯片,它是今天的重中之重,按照特斯拉的描述,它是当前世界上最强大的人工学习计算机,因为可以支持训练模块无限连接,因此理论上DOJO计算机的性能没有上限,下一代性能预计会有10倍提升。
DOJO计算机由训练模块组成,训练模块具备独立运行能力,支持无限连接,由25个D1芯片组成,算力高达9PFLOPs(9千万亿次),接口带宽36TB/s,特斯拉推出的机柜模型由120个训练模块组成,内置3000个D1芯片,超过100万个训练节点,算力1.1EFLOP。
● 人形机器人或2022年亮相
在AI日上还有彩蛋出现,马斯克为大家带来了人工智能机器人,原型机可能会在2022年亮相,对于这个项目特斯拉虽然足够严肃,但是也考虑到由于当前设想过于超前,也许可能并不会最终量产。不过随着人工智能技术、工程制造技术的进步,在不远的未来,乐观的预测,量产到来也并非遥不可及。
当前,开发人形机器人的现实意义在于,可以帮助人类从危险、重复以及复杂的工作中解脱出来,当这一天到来时,不仅可以让人类更加轻松的生活,还能利用更多的时间思考更有意义的事情。
特斯拉还公布了部分人形机器人的设计参数,高约1.7米,重约56.7千克,可以举起约20.4千克物品,硬拉重量约68千克,行进速度月8公里/时。能够实现与人类想进的手部动作能力,通过摄像头、人工智能技术神经网络、DOJO计算机实现身体控制。
● AI日招募更多人工智能人才
众所周知,特斯拉旗下产品的核心竞争力并非是纯电动零排放车辆,还有先进的自动驾驶技术,而这些都是人工智能技术领域的研究成果结晶,因此招募AI人才是特斯拉未来能持续保持领先优势的最优先选项之一,同时这也是AI日的目的之一。
自动驾驶车是一个轮式机器人。自动驾驶可以说是一个涉及了多个学科的综合领域,本文带你探寻自动驾驶的5大主要技术,看看这个轮式机器人的大脑、眼睛等都是如何工作的。
1、识别技术
和人类的眼睛一样,这个轮式机器人也有它自己的眼睛,用来识别周边的车辆、障碍物、行人等路上的情况。
我们眼睛的主要构成部分是眼球,通过调节晶状体的弯曲程度来改变晶状体焦距来获得实像。那自动驾驶的眼睛是由什么构成的呢?答案是传感器。包括摄像头、激光雷达、毫米波雷达,还有红外线、超声波雷达等。
你可能会惊讶,需要这么多眼睛?没错,它是长满了眼睛的小怪兽,通常拥有10+只眼睛。
其中,最常用的是摄像头,几乎是毫无争议地被所有开发者采用。它和人类的眼睛最接近,可以看清有颜色的标识、物体,看得懂字体,分得清红绿灯。但是缺点也不少,比如在夜晚或恶劣的天气下视力就严重下降,也不擅长远距离观察。
其次是颇富争议的LiDAR,即激光雷达。比较常见的是在车顶,像是顶不停旋转的帽子。原理很简单,就是通过计算激光束的反射时间和波长,可以完成绘制周边障碍物的3D图。而短板则是无法识别图像和颜色。
毫米波雷达也不得不提一提,因为它的全能--可以全天候工作,这使得它不可或缺,即便它无法识别高度,分辨率不高,也难以成像。但它凭借其穿透尘雾、雨雪的硬本领,站稳一席之地。
如此多各式各样的眼睛,那她的视力一定很好咯?那也未必。你以为星多天空亮,可它们之间能够互补还好,但也难免会产生矛盾。这么多只眼睛你要优先选择相信谁,这也是一个课题叫Sensor Fusion,传感器融合。根据每种传感器的优缺点来综合评判信息的准确度,得到更可靠的最终结果。传感器融合的另一个优点是,换来一定程度的冗余,即便某只眼睛暂时失明,也不会影响它安全前行。
2、决策技术
通过眼睛识别得到了周边环境,接下来就要充分利用这些信息进行理解分析,决定自己该如何走下一步。要完成这项任务的就是最强大脑。
跟人类的大脑一样,我们不是天生就会开车,也不是拿到驾照就成老司机了。需要一定的知识积累,自动驾驶机器人也同样需要。完成大脑中的知识库有两种方式:专家规则式和AI式。
专家规则式,英文叫rule-based。即提前编写好规则,当需要做决定的时候必须严格遵守这些规则。举个栗子,当准备超车变道时,需要满足以下条件(这是一个假专家,仅供参考):道路半径大于500R(弯道不变道);跟目标车道上的前后车的距离都在20m以上;比后车的车速慢不超过5km/h;等等等等...以上N个条件同时满足时,即可超车变道。
l IAI式,就是一直很火的人工智能Artificiantelligence。模仿人类的大脑,通过AI算法对场景进行理解。或提前通过大量的犯错积累经验,或事前听某人指点江山。通过AI式积累知识库,会让她的反应更加灵活。专家也难免有疏忽,更何况交通瞬息万变,没有灵活的大脑如何应对我大中华的路况呢?
3、定位技术
只有知道自己在哪里,才知道自己去哪里。
现今,除了主流的用GPS或GNSS(全球卫星导航系统)来定位的方式之外,也有在公路上铺设电磁诱导线等方式来实现定位。高精度GPS定位目前来说最大难题是,山区和隧道等地理因素对精度的影响,虽然可以依靠IMU(惯性测量单元)来进行推算,但GPS丢失信号时间过长的话,累计的误差就会比较大。
另外,自动驾驶专用的3D动态高清地图带给了自动驾驶更多可能性。因为有了高清地图,就可以将自己的位置轻松定位在车道上。
4、通信安全技术
试想如果被黑客入侵,控制了你的自动驾驶车,不仅可以监听到你的秘密谈话,还很可能成为杀人工具。黑客可以通过影响传感器的数据而影响决策,或直接介入判断机制进而影响行驶轨道。
先了解一个术语,V2X=Vehicle To Everything。即车辆与基础设施之间所有通信的通用简称,包括车辆与车辆之间叫V2V、车辆与行人之间V2P、车辆与交通基础设施之间V2I、车辆与网络之间V2N等。
V2X包含了汽车和我们的个人信息,因此在通信的时候对用户的身份验证和给数据加密,这些都必不可少。
5、人机交互技术
虽说我们对自动驾驶的印象大多是,不需要人们的干涉,它就能把我们送到任何想去的地方。但是很遗憾,目前的自动驾驶系统还做不到这一点。
遇到自动驾驶驾驭不了的场景,便会呼唤你接替它的工作。这时,HMI(人机界面)就发挥作用了。它的目标是,用最直观最便捷的方式通知我们,让驾驶员尽快注意到。
文|探员A
图|网络
编辑|kaka
北美时间2021年8月19日自动驾驶机器人的特斯拉“AI Day”自动驾驶机器人,就像其2019 年的“Autonomous Day”和 2020 年的“Battery Day”一样,把 科技 公司的调性拿捏的死死的。硬核的特斯拉再次出手,让传统车企,甚至很多 科技 公司都望尘莫及。
下面是猫头鹰情报局带来了内容快报。发布会可以大致分为三个部分:1-基于视觉和AI的自动驾驶研发进展;2-Dojo超级计算机;3-通用功用的特斯拉人形机器人。
01
—
基于纯视觉和AI的自动驾驶研发进展
虽然有蔚来NOP工况下事故影响的阴影,但这也阻挡不了特斯拉对完全自动驾驶的追求。就像人类在真正发明飞机之前,有着数不清的坠向地面,但是我们最终还是一飞冲天!
特斯拉首先秀出了最新版本的FSD。无保护路口左转、没有车道线的乡村道路、避让行人、路口停车、识别红绿灯……这些动作特斯拉都做得非常熟练。
特斯拉通过车身四周的8枚摄像头,形成三维矢量空间,感知出车身周围的环境。8个摄像头都采用1280*960分辨率12bit HDR图像,以每秒36帧的速率采集,就能够实现良好的感知效果。
摄像头除了识别车辆,特斯拉还会识别人、红绿灯等多种物体。在这个过程中,特斯拉还能够在感知过程中重建道路,通过标记车道线和其他物体。与此同时,特斯拉还会通过不同车辆收集同一路段的数据,并把不同车辆的数据合并在一起,最终实现更精确的重新建图。
在完成了精确的地图和数字环境重构后,另外一个挑战就是在环境中“标记物体“。只有车辆能够流畅地标记路旁物体,在准确识别物体之后,才能够实现流畅的城市道路自动驾驶。
今年5月,特斯拉面向美国市场销售的Model 3/Y车型取消了毫米波雷达,不过在雨、雾、雪等能见度较低的天气下,摄像头能看清楚吗?答案是能。仍然依靠短片记录驾驶场景,特斯拉每周能够获得1万段类似的恶劣环境短片,通过这些不同的短片一起合成从而重构周围的环境,来实现距离的感知。
随着特斯拉在路面上的车辆越来越多,记录和迭代的美国道路数据也会更加丰富,预计在美国道路上行驶的车辆的自动驾驶辅助功能也会日趋完善。
02
—
Dojo超级计算机
要处理大量的道路图像数据,需要海量的计算能力。这就是为什么特斯拉要自研Dojo超级计算机。发布会从单个芯片设计(Chip),芯片系统集成(System),计算机集成(Computer Cluster)及软件运用(Software)进行了了介绍。
Dojo超级计算机是特斯拉开发的专门用于神经网络训练的超级计算机。从D1芯片的开发到集成都完全由特斯拉在内部独立完成。用Elon的话来说,D1芯片可以实现媲美GPU的训练能力,同时兼具CPU的灵活性。
目前D1芯片已经在台架上完成了系统试验和运算。最后3000块这样的芯片会组成120个系统单元,一同成为特斯拉Dojo超级计算机。
该超级计算机可以是实现1.1 EFLOPS每秒浮点运算次数。一个EFLOPS等于每秒一百京/一百亿亿(10的18次方)次的浮点运算。这是什么概念?Dojo的运算速度比2021年6月公布的世界排名第一的超级计算机日本富岳,还要再快约2.5倍。
一个TFLOPS(teraFLOPS)等于每秒一兆/一万亿(1012)次的浮点运算
一个EFLOPS(exaFLOPS)等于每秒一百京/一百亿亿(1018)次的浮点运算
03
—
通用功用的特斯拉机器人
接下来的脑洞是猫头鹰情报局完全没有预料到的。马斯克自己登台发布了特斯拉机器人Tesla Bot。
从简介上来看这个机器人主要是为了将来替代人类进行一些危险的,重复的和无聊的工作。该机器人将有5英尺8英寸高(约合1.73米),体重有125磅(约合56.7千克),可抱起45磅重的货物(约合20.4千克),也可以通过举重硬拉姿势举起150磅的重物(约合68.0千克)。
比较自然的一个联想是,以后特斯拉会不会把这样的机器人安排在Gigafactory里面从事车辆生产工作,不过后面的QA环节里面,马斯克的回应是“工厂现在已经非常自动化了,人非常少,这个人形机器人的初衷并不是单纯为了造车”。
然后,发布会公布了一部分关键的机械结构细节和感知智能系统。它的四肢使用40个机电执行器进行操作,并通过力反馈感应系统来实现平稳和敏捷双脚行走,最快行走速度可能为5英里/小时(约合8公里/小时)。马斯克说:“如果这机器人‘造反’了,你还是能跑的过他的。”
这一个环节和之前的内容都有关联。这个人形机器人会利用目前FSD的硬件,和之前在第一个部分提到的视觉训练,自动标签等算法来实现周围的环境感知和识别,而这一过程也会借助于Dojo进行开发和训练。
04
—
一场披着技术发布的“人才招募会”
最后,Elon向全世界人才发出了召集令。招募顶尖的AI人才加入。这个也是Elon技术发布会的核心目的。
这样“秀肌肉”的技术发布会,面向的群体更多的是行业领域的专业人士,也是特斯拉招揽顶尖人才的独特方式。
事实上,美国近几年在统计工程类专业学生最想去的公司排名中,特斯拉和SpaceX其实都是名列前茅。
猫头鹰观察
—
从本次“AI Day”可以看到,一向特立独行的特斯拉,依旧走在一条自主创新的路上。比如,特斯拉抛弃了主流的激光雷达方案,试图证明纯视觉的解决方案可以实现自动驾驶;在 汽车 产品外,特斯拉还推出了服务型机器人,外观上比其他机器人更像“人”。没有太多的舞台效果,这场发布会更像是科研机构里面的学术交流专题会,展示了马斯克的意志,以及他所认为的未来。
【太平洋汽车网】自动驾驶汽车,又称无人驾驶汽车、电脑驾驶汽车或轮式移动机器人,为一种运输动力的无人地面载具。作为自动化载具,自动驾驶汽车不需要人类操作即能感测其环境及导航。
在美国,美国国家公路交通安全管理局(NHTSA)已提出正式的自动驾驶五等级分类系统(2016年版本):
等级0:即无自动。驾驶随时掌握著车辆的所有机械、物理功能,仅配备警报装置等等无关主动驾驶的功能也算在内。
无自动驾驶,就是驾驶员完全手工驾驶,一点不能分心。
等级1:驾驶者操作车辆,但个别的装置有时能发挥作用,如电子稳定程式(ESP)或防锁死刹车系统(ABS)可以帮助行车安全。
只是可以起到一个辅助的作用,驾车主力还是驾驶员。
等级2:驾驶者主要控制车辆,但系统阶调地自动化,使之明显减轻操作负担,例如主动式巡航定速(ACC)结合自动跟车和车道偏离警示,而自动紧急煞停系统(AEB)透过盲点侦测和汽车防撞系统的部分技术结合。
等级3:驾驶者需随时准备控制车辆,自动驾驶辅助控制期间,如在跟车时虽然可以暂时免于操作,但当汽车侦测到需要驾驶者的情形时,会立即回归让驾驶者接管其后续控制,驾驶必须接手因应系统无力处理的状况。
等级4:驾驶者可在条件允许下让车辆完整自驾,启动自动驾驶后,一般不必介入控制,此车可以按照设定之道路通则(如高速公路中,平顺的车流与标准化的路标、明显的提示线),执行包含转弯、换车道与加速等工作,除了严苛气候或道路模糊不清、意外,或是自动驾驶的路段已经结束等等,系统并提供驾驶者“足够宽裕之转换时间”,驾驶应监看车辆运作,但可包括有旁观下的无人停车功能。
等级5:驾驶者不必在车内,任何时刻都不会控制到车辆。此类车辆能自行启动驾驶装置,全程也不须开在设计好的路况,就可以执行所有与安全有关之重要功能,包括没有人在车上时的情形,完全不需受驾驶意志所控,可以自行决策。
(图/文/摄:太平洋汽车网问答叫兽)