点击注册申博 申博登录地址 申博官网在线客服
申博 您当前所在的位置:申博 > 申博 >

【回顾附自动驾驶试乘视频】自动驾驶的赋能者

未知   admin   2019-03-24 05:16   
  【回顾附自动驾驶试乘视频】自动驾驶的赋能者
 
 
 

  (先上段视频感受一下百度+英伟达+哈弗H7打造的“L2.5“”自动驾驶试乘)

  几乎就在刷屏的同时,百度智能汽车事业部(Baidu iV)总经理顾维灏正在另一个场合用另外一组PPT介绍包括“阿波罗计划”(Project Apollo)在内的百度自动驾驶的最新进展。这个场合是正在上海举行的2017年亚洲消费电子展(CES Asia 2017),顾维灏代表百度发表了此次展会的唯一一个和汽车和自动驾驶相关的主题演讲。

  还好,顾维灏身后的PPT没有出现任何错别字,只有纯干货(PPT以及演讲实录在本文下方,往下拉不要错过哦)。

安全演讲视频,必赢国际

  演讲的主题是“自动驾驶新浪潮”,顾维灏讲了大概45分钟左右,主要介绍了百度在自动驾驶方面所积累的一些经验“宝藏”,在自动驾驶算法上所做的一些探索和实践,与硬件供应商合作推出BCU(Baidu Computing Unit)概念重新定位自己在产业链的位置,最后透露了一些百度即将在7月5日发布的“阿波罗计划”,也就是在上海车展期间宣布的要向汽车行业及自动驾驶领域的合作伙伴提供一个开放、完整、安全的软件平台,帮助他们结合车辆和硬件系统,快速搭建一套属于自己的完整的自动驾驶系统。

安全演讲视频,必赢国际

安全演讲视频,必赢国际

  整个演讲有关“阿波罗计划”的内容也就在最后的5分钟,但实际上前面40分钟的内容和“阿波罗计划”有直接的关系(但顾维灏说这些内容对于整个“阿波罗计划”来说都是凤毛麟角或九牛一毛)。

  到底何为“阿波罗计划”?从演讲中透露的信息和我的理解来看,“阿波罗计划”就是提供一套包含了四个层次的生态系统框架,可供任何人或公司下载但对这四个层次的合作伙伴提出了在硬件和接口开放的要求。这个框架会在7月5日的发布会上开放,今年12月的时候会在乌镇演示框架的能力来供所有合作伙伴去使用和学习。

安全演讲视频,必赢国际

  “我们希望通过这种框架让大家参与进来,百度成为行业的赋能者。因为接下来自动驾驶是一个完全非常大的市场。汽车产业链又是非常复杂全面的产业链。我们希望原来的和新进入的伙伴在新增市场找到自己该有的位置去提供自己该有的核心能力加快产业的发展,同时我们也会通过框架保证自动驾驶的安全。”顾维灏说。

安全演讲视频,必赢国际

  总结来说,百度的野心很大。百度开源自动驾驶技术已成全球自动驾驶领域的里程碑事件,它要做的事儿就是进一步降低自动驾驶的研发门槛,引领行业打造第一个完整的、开放的自动驾驶平台。

  其实从百度近期各种的签签签,包括之前和博世高德四维图新的合作,和tier-1大陆和博世的单独战略合作,以及在6月7日CES Asia 2017开展当天和4家硬件供应商德赛西威、联合汽车电子、航盛电子以及博泰围绕BCU和MapAuto(百度地图汽车版)的两个方面进行签约,不难看出百度正在为了它的“阿波罗计划”生态拉拢行业合作伙伴入群,解决自己在算法软件方面的优势技术如何落地。百度要做的事情不非就是回答主机厂的问题:你们的技术该如何应用到汽车的自动驾驶当中?从某种意义上来看,百度越来越成为一家自动驾驶的一级零部件供应商,把自家的技术整合在合作伙伴的硬件中打包“卖给”主机厂客户,有点儿类似于德尔福英特尔Mobileye合作打造的CSLP中央传感定位与规划系统。

  在CES Asia展览现场N3馆外,百度自己搭建了一块小小的无人驾驶“示范区”,用了一台仅搭载了一个消费级的摄像头加上英伟达的PS2 GPU芯片以及自己的端到端深度学习算法的长城哈弗 H7,供参展者试乘。《中国汽车要闻》也有幸在现场与其他媒体小伙伴一起试乘体验了一下。再感受一下:

  总体来讲,试乘的这款H7应该是达到了处于L2和L3级别之间的某种程度的自动驾驶,几乎接近于Hands Off。第一感觉就是在自动驾驶状态下车比想象的要aggressive但不鲁莽。一个摄像头加一个GPU加上百度自己的LSTM+CNN深度学习算法打造的联合解决方案,以最少以及最低成本的硬软件来达到某种级别的自动驾驶。

安全演讲视频,必赢国际

  第一次我来的时候(2015年),我和我的小伙伴提了一个手提箱,每一个OEM(主机厂)我们都去拜访,向他们展示当时我们研发的一款产品:一款手机和车机互联的产品叫CarLife。

  我们欣喜的发现,第二年来的时候 很多展台上已经把CarLife做成一个展点。第二次参加 CES Asia的时候我们有了一个展台,我记得是67平米,布置了当时引以为豪引领发展的CarLife,包含高精地图。那个时候我们认为高精地图接下来是自动驾驶非常重要的一个基础。

  今年第三次参加CES Asia,我们在 N3馆有了一个更大的展台,我们继续展示高精地图。如果你仔细观察汽车馆的时候自动驾驶发现几乎所有的自动驾驶都在说一件事情:高精地图是他们的基础。

安全演讲视频,必赢国际

  所以CES Asia是一个很好的展会,它引领了一个时代或前沿技术的发展。

安全演讲视频,必赢国际

  这次展会, 除了高精地图以外,还带来了自己更多更新鲜面向智能汽车自动驾驶智能驾驶新的产品。如果你到我们展台还会发现我们有一个互动的AR大屏:他展示的是自动驾驶仿真技术。主要是解决测试的问题。未来的自动驾驶他的能力一定超过人类,但如何超过人类?必须要在真实道路上和真是环境上实现。那要实现多少才能达到人类的水平?有很多论文和Paper在计算这些东西,其中我看到的一篇论文比较著名的是说:通过各种可信度置信度计算,非常简单的公式,通过计算后,结论是理想情况下汽车需要行驶2亿英里才能达到人类水平。Tesla通过自己能力的计算需要6亿英里。对于中国来讲路况更复杂,又要测试多少公里里程才能让自动驾驶车辆赶上或超过人类?所以我们建立了一个仿真的环境,我们把我们采集的高精地图灌入我们的仿真环境里建立了一个虚拟现实3D环境。同时把车辆自动驾驶算法和动力模型加入仿真器里, 随时的不停歇的去进行测试。这样就会更好地加快自动驾驶测试过程。

安全演讲视频,必赢国际

  新的自动驾驶靠深度学习时代发展。深度学习或机器学习最重要的一个发展拐点是2006年。在那个时代,我是2006年左右有幸参与了最早的百度云技术的发展。最早2006年深度学习的发展最主要驱动的就是语音识别技术。当时微软一位科学家把DNN(Deep Neural Networks深度神经网络)深度学习第一次带进语音识别。当时整个的声音语料和文本语料都非常小,只有几兆十几兆。安装在汽车上语音识别的模型就会更小。正是因为2006年左右手机的发展、移动互联网的兴起带动了语音语料和文本语料快速积累和膨胀。原来的解码器语音识别引擎已经很难去解码和适应适应这么大的语料。

安全演讲视频,必赢国际

  在2006年之前语音识别的错误率,也就是知错率是30%左右,也就是说每说3句话有一句话错误。有了DNN的存在和更大的语料存在,现在目前最先进的语音识别引擎的知错率已经超过了人类,可能是一个个位数大概2.1%知错率,非常接近或超过人类。之后又出现了图像,移动互联网手机更加普及了。每天都在拍照,图像的数据积累也促进了图像识别的发展。有更多的深度学习模型得到快速发展。

  人工智能最关键有两点:1)你有没有足够多的数据,这是基础;2)你有没有能力将这些转化为知识。刚才的语音识别把语音转换为文字是知识转化的能力。图像就是识别一只猫一只狗识别一个汽车也是知识的转化。只有你同时具备了数据和把数据转化成知识的能力才能称得上是人工智能。

  百度其实是一家人工智能公司,在过去的十几年发展里我们是最好的中文搜索引擎。这个时代我们积累了大量文本的数据。现在在互联网上过去十几年存在的每一个网页在我们的数据里都有存在。这么大的数据库通过搜索引擎排序算法怎么更好的展现给不同的搜索者?

安全演讲视频,必赢国际

  最早的时候比较简单:初始页面加一个站点,计算每一个网页和检索,所有人看到检索百度公司的搜索结果都一样。随着对搜索引擎要求越来越高,我们其实对搜索引擎的算法也提出了更多的要求。百度是最早引入机器学习算法作为搜索引擎的算法,同时加入了个性化使得每个人看到的搜索结果针对于个人的特点有不同的排序。伴随时代的发展还有一个计算能力的提升。之所以说过去有一点时间识别的效果不好搜索效果不好都是因为面对有限资源的时候要做tradeoff(取舍),会去主动进行剪枝,让搜索空间变小,拿出来的准确的东西更快,但会丧失一些好结果。随着计算能力的提升,包括GPU、CPU等发展,搜索空间变得更大。这个时候我们的好的结果被砍掉的几率就会变得很小,更相关的结果就会排到前面。

  自动驾驶所面对的环境更复杂。搜索面临的是结构化的数据,但是在自动驾驶遇到的是完全不一样的数据:跟多的图像数据,传感器回传回来的复杂数据,如Lidar激光雷达的数据,Radar雷达传回来的是探测结果的数据,Camera摄像头传回来是影像数据等,更多现实环境的数据,让数据更加复杂不一样。这个时候就需要更多更新更快的深度学习算法出现。也会要求训练的时候,速度也要求更大,要求的计算资源不同。当我们把他放到汽车上,很多实时计算,就需要实时计算能力越来越强,车载计算芯片的要求也越来越大。在过去的一两年,自动驾驶在三个方面所需要的数据算法和计算能力都在不断提高,导致自动驾驶更快的到来。

  针对自动驾驶,有很多新的算法出现。我认为现在自动驾驶还处在一个相对比较早期的一个阶段。各种算法,各种方式,百家争鸣,各不相同。如果对这个行业有所关注有所了解的话,可能会看到过去的十多年,每一个公司不管是创业公司还是成熟公司都在演示自己的自动驾驶。每一个车辆搭载的传感器都会不一样。不管是种类:激光雷达、毫米波雷达、超声波雷达、前视摄像头、全视摄像头、黑白摄像头、彩色摄像头、俯角120度摄像头还是俯角15度,各种传感器都会有,数量也不一样。越早期的会扛更多的设备。相对比较成熟的会扛少一些设备,或者是和未来量产的设备。不同个数的传感器要求的算法复杂度或种类也会不一样。比如说以图像为主要处理图像的数据就会更加频繁主流的去使用CNN(Convolutional Neural Networks 卷积神经网络)。它能够对于图像并行计算、目标识别等在行。对于Lidar和 Radar这种数据量更大的散点数据需要不同的其他深度学习算法。如果我们的目标是希望自动驾驶时代尽快到来,必须要考虑一个问题:究竟多块?2015年?2019年?2018年?如果更快那就必须要考虑非常现实的问题:我们用什么样的传感器才能让自动驾驶更快的到来?我和其中的一部分选择答案用今天成熟的传感器和便宜的传感器越成熟越便宜我们能实现自动驾驶才能让这个时代尽快到来。我们不断的去严格要求我们自己用更便宜更成熟的传感器用更先进的深度学习算法实现自动驾驶。

安全演讲视频,必赢国际

  实践也就是我们的Road Hackers(道路黑客)。我们的目标是通过一个消费级的摄像头通过深度学习就能实现自动驾驶。这是我们最苛刻的一个实现。但在未来的发展,也许2019年2020年不可能只依赖一个方案达到自动驾驶,还得需要Radar或者其他传感器才能让这个时代尽快到来。如果今天最苛刻的环境,要求的更严,在明天这个对于安全性和和扩展性就会更方便。通过一个传感器和深度学习算法和过去积累的大量数据来实现自动驾驶。

  秉着这样一个想法,在去年的时候我们就开始了一系列的调研工作。研究的时候发现,我们在过去的积累里做了非常牛的事情。在2013年的时候,当时我还在做地图,我们升级了所有的地图采集车辆,都加上了最先进的设备和传感器。采集的过程中,我们记录下了所有影像。今天上百度地图你会看到家门口再小的道路都会有街景图片,把他给记录和拼接出来。开车同时还记录了很多采集车的司机的所有的行为,包括打方向盘的行为踩油门的行为,加速,刹车的行为,所有行为都记录下来。去年的时候发现了这样的宝藏。我们的百度地图采集车应该是中国最大规模设备最先进的采集车,每天都有几百辆在全中国各个角落上去行驶,每年采集的里程都是几百万公里。从2013年到去年我们发现我们有一个全中国最大的一个记录着行为的宝库,然后我们开始挖掘行为。当我看到照片的时候司机他做了什么行为?转向还是刹车还是加速?所有行为挖掘出来再用当时一套比较先进的深度学习CNN算法做了预测制作出来了这个视频,是在今年1月份美国CES的时候正式发布了视频。

安全演讲视频,必赢国际

  这段视频简单介绍一下:红色线代表方向盘转的角度,左侧上半部分体现了这一点,是司机实际的转向程度;绿色线代表后来的算法预测当我司机看到图片的时候应该是一个怎么样的转角。下半部分是加速度的实际情况和预测:红色是实际加速度,正的是加速,负的是减速,绿色是通过影像预测出来司机是加速还是减速。从图上可以看到预测和实际的驾驶方向盘转角已经相对比较接近了程度。看到收敛的趋势会越来越明显,找到了关键。但加速度方面预测的东西和实际还是偏差比较大。 这个时候所有的预测包括转角和加速度都用CNN这种深度学习方法所带来的不好的地方。我们意识到这样的宝藏只靠有限的人员挖掘实现我们的能力还是比较有限的,速度迭代还是不够快,所以就把这套想法开放了出去。

安全演讲视频,必赢国际

  我们开放了训练的部分数据,大概是1万公里Road Hackers原始数据,包含采集车上搜集的所有数据:天气不管是晴天、雪天、阴天、雪天,不管是羊肠大路还是曲径小路,不管是风景秀丽的景区还是满地都是泥泞的地方去开,所有数据记录下来,影像数据,高精度GPS数据,IMU传感器数据,按照刚才的思路挖掘出来开放给整个社会。

安全演讲视频,必赢国际

  当然开放数据还不够,百度是一个技术信仰的公司。我们相信技术能够改变一切。每一个季度百度都有技术比武的比赛叫Hackathon开发马拉松。在有限时间内设定有限场景去比拼谁的产品做的最好,谁的算法最好。首届百度Road Hackers挑战赛从CES回来以后。同学们要做一个比赛,开放数据,现在benchmark方向盘转角偏差收敛的程度是这样的,加速度偏差收敛是这样的,现在在这个平台上比赛看谁的算法收敛变得更加明显,训练速度变得更快。我们有50队伍,每个队伍3-4人。进行了为期一个月的技术比武。到最后比出来了。也给前三只队伍发奖,奖励了最先进的无人机。这种技术比武最重要的是交流和共享。所有算法分享出来,胜出的队伍和自己的团队和工程师充分交流和去完善算法。

安全演讲视频,必赢国际

  我们的深度学习结构图。第一版的时候,1月份都是用CNN一种模式实现。通过技术比武和迭代,我们发现可以再引入一种具有时间记忆的新的算法来实现纵向控制或者更好的横向控制。在这个网络结构里,底层的图像本身自动提取识别上面仍然是CNN自动抽取特征,用在方向转速。在纵向控制引入一个新的模型,具有神经记忆的模型:我不仅仅通过这张图片看我现在需要的,而是根据过去的10张甚至是100张预测接下来究竟怎么做。这种技术最早也是在语音识别上应用叫Long Short-Term Memory( LSTM)。只要我们考虑延续性的行为预测时候就会考虑这个模型包括RNN(Recurrent Neural Networks循环神经网络)和更长的深度记忆模型LSTM。把这种模型引入到纵向控制里就会有新的突破:加速减速更加流畅和舒服。

  这就是把刚才的算法经过内部引以为豪的更长时间沉淀优化了算法,大量的几年的地图采集的一些数据训练和完善算法。刚才镜头看到一个驾校的真正的司机开着这个车绕着既定路线再开。开了几遍之后,开车的行为完整的记录下来,训练深度学习网络结构,经过剪枝优化放到汽车上。只加了一个消费级的摄像头,看到了汽车影像结合深度学习网络判断接下来是转轮还是刹车还是加速。

安全演讲视频,必赢国际

  这辆汽车展会开展前10天主办方让我们进入场地,重新铺设场地把司机请到了上海根据上海的天气又在做新的实验。恰好在展会开幕的前两天上海阴雨天气在下雨,在实践和训练算法。现在这辆车N3馆场外都可以报名预约。我们用的长城汽车,Nvidia最快的GPU芯片PS2。还有百度三家一起展示的只基于一个摄像头和端到端深度学习的自动驾驶的展示。

安全演讲视频,必赢国际

  刚才讲的是自己更苛刻的要求,对技术上更高的追求,更低成本便宜的解决方案。实际上同时我们也在实践测试着更多自动驾驶解决方案,包括逻辑可解释性的自动驾驶方案。把自动驾驶拆解:首先要自定位,在哪儿。接下来做环境的感知,如果我要能清楚周围有什么,大家在干什么,我该怎么办,这是一个逻辑的可拆解过程。模块儿也在处理。都要基于安全信息安全基础,同时具备更新能力。

  自动驾驶包括技术上的讲解在过去两年我和我的同事朋友们走遍了很多几乎所有中国或国外主流的OEM。在去年的时候,结识了一些新的朋友。过了一年比较熟悉了。有些OEM朋友问,你们说的技术很牛,我也知道你们做的不错,吹得还不错。但是我们不知道我们应该怎么使用。当一个朋友在和我这么讲的时候,我会觉得你为什么会有这样的问题。但当5个OEM的朋友在和我说同样的问题时候,我们就开始反思:我们的技术该如何应用到汽车的自动驾驶当中?因为汽车的产业链是非常长丰富的,很多角色和朋友,我们有OEM,有 tier-1,2或3,我们自己的定位是什么?我们改该怎么和产业链融合才能让自动驾驶这些技术真正实践到量产自动驾驶汽车上?

安全演讲视频,必赢国际

  反思了之后,我们推出了我们的新的概念叫BCU(Baidu Computing Unit)。所有的软件和算法在新的人工智能时代需要硬件来搭载。你只有把你的能力依托到硬件上安到一个地方你的能力才能使用。我们就把这种想法跟几乎所有做硬件的朋友们重新交流一遍。原来只是和OEM交流,我们开始和所有行业的tier-1和 可以做硬件的tier-2交流,大家一起来做这件事。第一次交流是和惠州的一个tier- 1。第一次做视频交流,谁也不认识谁。大家都觉得成本比较高,去惠州成本高,我们就做了视频交流。在视频过程中被彼此深深吸引了,坚定了走这条路的方法。后来我们找到了更多的tier- 1,把我们算法对硬件的要求告诉他们,我们需要多大的计算能力,多少存储空间,多少功耗才能把算法寄存到硬件上并更快的集成到量产汽车上。

  我们就跟tier-1开始各种交流。像AI的模块如自定位能力。这是自动驾驶的基础,他要告诉汽车在哪里。我们实现自定位的方法是基于高精地图。我们已经采过了中国几乎所有高速的高精地图,记录了道路的每一个实体元素它实际的大小和位置。这个时候只要在汽车上装一个摄像头,把影像做各种各样的信息提取包括车道线、标志牌、路灯等把定位的标志物提取出来和我的高精地图做一个实际的匹配,这个时候能把本车的准确定位做出来。

安全演讲视频,必赢国际

  这个视频是在实际道路上测试的视频。最关键的是在下面那行的小字儿。这两行小字是定位精度的概率分布。第二列是横向精度,第三列是纵向精度。我们的定位方法是物理标注影像中提取出来和高精地图匹配出来的。所以横向定位精度达到98%或99%的概率都在0.2米或20厘米以内,就是每个车道宽度是15-20厘米,这样的定位保证汽车能真实的在自己的车道行驶。纵向定位精度差不多是80%-90%左右概率在2米左右。在一些变化场景下,如道路出入口、车道线条,这个时候物理标志越来越多,前方提示要出去或进入等,有了这么多这种定位参考后,定位精度可以达到1米以内,平均在3米或2米左右。高速自动驾驶这种定位精度已经足够了。

  我们把我们的定位能力和各种感知的能力和路线规划能力和所有的tier-1做出了实实在在的自动驾驶量产的BCU硬件。非常感谢合作伙伴包括德赛西威、联合汽车电子等帮助我们的想法能快速实现出来。我们分成三种:一种叫定位BCU-MLOC(Map Localization),第二种可以作为环境的感知叫 BCU-MLOP(Map Localization & Perception),第三种加入了Planning规划,叫做 BCU-MLOP2 (Map Localization, Perception and Planning)。有了这种实实在在的硬件后,所有的量产化的想法,赋能这个行业让行业加速的想法,才能够得以快速实现。我们展台上,每一类的BCU都会有一个实际的展示。

安全演讲视频,必赢国际

  刚才介绍的所有的事情相比于在4月份上海车展公布的阿波罗计划都是凤毛麟角或九牛一毛。

  阿波罗是一个完整的、安全的、开放的一套生态系统架构。它包含了四个层次:最下面叫参考汽车层,往上一层叫参考硬件层,再往上一层叫软件平台层,最顶层是云服务层。首先它是一套完整的框架:任何一个公司,任何一个人,只要你有能力都可以从网上下载阿波罗的框架。有了这种框架按照我们参考的硬件设计汽车你就可以做出一辆和百度能力一样的自动驾驶汽车了。我们只是给出了我们需要的要求。参考汽车层,我们需要你打开线控、转向、刹车、油门的接口。参考硬件层,什么位置要安装什么传感器?是5个 雷达一个雷达?一个摄像头还是几个摄像头?这些都是参考。你有了这样的汽车按照参考组装了汽车就完成了第一步。

安全演讲视频,必赢国际

  第二部是可以使用开放能力的软件平台能力:包括自定位、感知、规划和决策,也包括一系列的复杂的工具。有了开放的软件框架后,就可以部署在汽车上,在云端里,你的车就可以开了。

  在4月份公布的“阿波罗计划”里,我们下个月会开放框架,开放场内自动驾驶的整套开发能力。在今年12月的时候,整个乌镇的这些能力也会开放到整套框架来供所有的合作伙伴去使用和学习。

  百度希望通过这种框架让大家参与进来,让百度成为行业的赋能者。因为接下来自动驾驶是一个完全非常大的市场。汽车产业链又是非常复杂全面的产业链。我们希望原来和新的伙伴在新增市场找到自己该有的位置去提供自己该有的核心的能力加快产业的发展,同时我们也会通过框架保证自动驾驶的安全。

安全演讲视频,必赢国际

  更多的阿波罗的介绍7月5日百度COO陆奇会说的更详细,我们真心把自己当成产业的一个赋能者加快整个行业的发展,让自动驾驶更快到来。

  ©本刊所有图片、文字及版式版权均为【中国汽车要闻】(China Business Update)所有,未经授权许可,不得复制或用作其它商业用途,其他网站及平面媒体如需转载,须注明作者及出处。

  声明:本文由入驻搜狐公众平台的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。

  动力充沛配置丰富外观好看内饰好看储物空间小配置低油耗高中控台简陋性价比低看看网友怎么说》