自动驾驶汽车的车载芯片发展介绍
当前车载芯片缺货情况十分严重。英特尔、英飞凌、意法半导体、恩智浦、德州仪器、安森美等超过50家半导体在马来西亚设厂,由于疫情的影响,马来西亚某芯片代工厂大约有1000名员工感染了新冠病毒,该工厂目前无法开工,导致博世公司的ESP/IPB、VCU、TCU等产品没有芯片可以使用,进一步影响到使用博世公司上述产品的主机厂的汽车产能。除了上述系统的芯片,随着智能驾驶系统的发展和零件成本的降低,未来L3和L4自动驾驶技术需要更多高算力、低成本的车载芯片,这些芯片作为自动驾驶计算的主芯片,有着非常重要的作用。本文将介绍目前几款广泛应用于无人驾驶行业的车载芯片,并对其进行分析。
1.自动驾驶系统的组成
在介绍自动驾驶的车载芯片之前,我们先来看一下自动驾驶的系统组成,自动驾驶的系统组成主要分为3层——感知层、决策层和执行层。感知层主要由激光雷达、 摄像头、高精度地图、IMU/GPS等部分构成,主要负责对车辆周边的环境进行感知;决策层主要以感知信息数据为基础,通过驾驶员在环判断、场景分析、地图数据、车辆状态等信息进行驾驶决策及路径规划;执行层基于决策层给出的驾驶决策,对动力系统、制动系统和转向系统进行横向和纵向的控制。其系统构成图如图1至3所示:
图1 自动驾驶感知层的构成
图2 自动驾驶决策层的构成
图3 自动驾驶执行层的构成
2.自动驾驶对于芯片算力的要求
自动驾驶汽车涉及到传感器环境感知、高精地图/GPS精准定位、传感器数据融合、决策与规划算法运算、控制与执行等过程。实现以上过程需要强有力的处理器来处理海量的数据并进行复杂的逻辑运算,这对计算能力的要求非常高。
根据某机构测算,自动驾驶等级每增加一级,所需要的芯片算力就会呈现十数倍的上升,L2级自动驾驶的算力需求仅要求2-2.5TOPS,但是L3级自动驾驶算力需求就需要20-30TOPS,到L4级需要200TOPS以上,L5级别算力需求则超过2000TOPS。
注:TOPS是Tera Operations Per Second的缩写,1TOPS代表处理器每秒钟可进行一万亿次(10^12)操作
全自动驾驶时代,每辆汽车每天产生的数据量约为4000GB。现在已经量产的自动驾驶车载芯片的情况可以参考表1。
表1 当前已量产自动驾驶车载芯片的情况
目前看到的特斯拉单芯片算力是量产里面最强算力的,达到72 TOPS。随着自动驾驶等级的提升,传感器融合数据量的大量增加等因素,现在的自动驾驶车载芯片的算力已经无法满足部分L3级自动驾驶的要求,因此各厂商分别开发了新一代自动驾驶的车载芯片。
3.特斯拉FSD HW3.0
HW3.0 由两个相同的计算单元构成,每个计算单元上面有特斯拉自研的2块FSD计算芯片,每块算力为36Tops,设备总算力为4x36 Tops=144 Tops。其硬件芯片如图4所示:
图4 特斯拉FSD HW3.0硬件芯片图
特斯拉板子的右侧接口从上到下依次是FOV摄像头、环视摄像头、A柱左右摄像头、B柱左右摄像头、前视主摄像头、车内DMS摄像头、后摄像头、GPS同轴天线。左侧从上到下依次是第二供电和I/O接口(车身LIN网络等),以太网IO、USB调试接口、烧录接口、供电和CAN接口。
FSD HW3.0中央处理器是1个12核心的ARM A72架构的64位处理器,运行频率为2.2GHz;图像处理器能够提供0.6TFLOPS计算能力,运行频率为1GHz;2个神经网络处理器运行在2.2GHz频率下能提供72TOPS的处理能力。为了提升神经网络处理器的内存存取速度以提升计算能力,每颗FSD芯片内部还集成了32MB高速缓存。
基于上述特斯拉的芯片数据,L3级自动驾驶的算力需求约为20-30TOPS,特斯拉的芯片完全可以满足使用需求。特斯拉正与博通合作研发新款 HW 4.0 自动驾驶芯片,预计2022年第四季度就将大规模量产,新一代芯片采用7nm工艺。预计HW4.0算力有望达到432 TOPS以上,超过HW3.0的三倍以上,将可用于ADAS、电动车动力传动、车载娱乐系统和车身电子四大领域的计算。
4. Mobileye EyeQ5
Mobileye EyeQ5将使用8枚多线程CPU内核,同时还会搭载18枚Mobileye的下一代视觉处理器。其系统架构图如图5所示:
图5 Mobileye EyeQ5系统架构图
EyeQ5具有更为复杂的功能,将采用7nm制程工艺。EyeQ5最多支持20个外部传感器(摄像头、雷达或激光雷达),多传感器融合是EyeQ5推出的主要目的。EyeQ5运算性能达到了12Tera/每秒,功耗低于5W,芯片节能效率是对标产品Drive Xavier的2.4倍,算力为24TOPS。EyeQ5实行“开放式”战略,Tier1和主机厂等合作伙伴都可以使用开放式架构来写入自己的代码,包括传感器融合和驾驶决策等。极氪001使用了2颗Mobileye EyeQ5芯片,并且搭载了15个摄像头,1个250 m LRR超长距毫米波雷达和12个超声波雷达。基于上述配置可以实现包括自动变道、不同高速公路之间的导航、自动上/下匝道的高速公路自动驾驶以及城市道路辅助驾驶、自动泊车、L2级ADAS功能和DMS驾驶员监控系统。
5. 英伟达Orin
2019年12月,英伟达发布了新一代面向自动驾驶和机器人领域Orin芯片和计算平台,可扩展、可编程,具有ARM Hercules CPU内核和英伟达下一代GPU架构。Orin SoC包含170亿晶体管,晶体管的数量几乎是Xavier SoC的两倍,具有12个ARM Hercules内核,将集成下一代Nvidia GPU,提供200 TOPS@INT8性能,接近Xavier SoC的7倍,Orin SOC将在2021年提供样片,2022年正式面向车厂量产。Orin芯片如图6所示。
图6 英伟达Orin芯片
蔚来ET7搭载了4颗NVDIA Drive Orin芯片以及11颗800万像素的摄像头,每秒钟可以产生8GB的视频,对于自动驾驶的视觉识别技术,需要保持每秒钟超过10个以上的图片识别请求效率,Orin芯片可以满足这一使用需求。这4颗芯片中的2颗芯片负责自动驾驶,1颗为冗余芯片,最后1颗负责群体智能与个性训练,共包括48个CPU内核,256个矩阵运算单元,8096个浮点运算单元和680亿个晶体管。Orin芯片可以保证系统高效稳定地运行在蔚来的这套NAD系统上。
6. 地平线征程5
征程5系列芯片基于SGS TV Saar认证的汽车功能安全(ISO 26262)产品开发流程体系打造,获得ASIL-B Ready产品认证的车规级智能芯片,单颗芯片算力最高可达128 TOPS,同时支持16路摄像头感知计算,800万像素单目前视感知摄像头结构化输出延迟小于60毫秒。基于征程5打造整车智能平台,AI算力最高可达1024TOPS,允许48路摄像头接入,兼备业界最高 FPS(frame per second)性能与最低功耗。对于L3至L4的自动驾驶应用,该芯片可以满足使用需求。
6. 总结
针对未来自动驾驶汽车使用的车载芯片,特斯拉自研芯片并且应用到自己的产品(Model3、Model S和Model Y等多款车型),其FSD芯片算力水平较高,配合特斯拉自己的深度学习网络,其一直主打纯视觉自动驾驶解决方案,闭环性做的比较好。Mobileye有庞大用户基础,德系车、美系车和韩系车都倾向于使用Mobileye的技术方案,但是其摄像头产生的原始数据是以Mobileye的特殊格式保存的,必须要用Mobileye自己的工具链才能打开,并且目前EyeQ系列产品更新速度太慢,其算力水平相较于其他厂家也处于落后状态,具体的市场表现还要看用户体验。英伟达几乎是自动驾驶芯片平台的王者,其性能较好并且具有较强的可靠性,受到各大主机厂的青睐。地平线拥有完整的算法、芯片、工具链一体化的服务能力,拥有专门的软件算法团队协助主机厂开发,并且与主机厂进行深度合作,其合作生态模式较为开放,未来前景可期。
未来自动驾驶汽车的芯片会逐渐朝着高算力(单颗芯片算力超过200TOPS),低功耗,高水平制造工艺等方面发展,激光雷达接口(6个及以上)、摄像头接口数量(10个以上)都会增加,并且会符合车规级功能安全等级(一般为ASIL-D)。芯片是一辆汽车的“大脑”,各家主机厂、科技公司、供应商等都在为自研芯片和系统解决方案在努力,未来芯片也会成为各大厂商及科技公司的“杀手锏”。
作者简介:
程增木,芯片之家(chiphome)联合创始人,国家注册信息系统项目管理师,中国自动化标准委员会委员,机械工业出版社特约编者及审稿专家,青岛市即墨区交通运输局项目顾问专家,山东交通学院外聘教师,Intel无人驾驶应用白皮书编者,《汽车维修与保养》学术期刊编委会委员,中国自动化学会及中国机械工程学会会员,中科信软培训中心讲师,得捷电子KOL讲坛大师。出版学术著作《智能网联汽车技术入门一本通》、《智能网联汽车技术概论、《智能网联汽车技术原理与应用》。
发表学术论文14篇,其中EI收录4篇,授权专利3项。 在IEEE人工智能与模式识别国际学术会议、IEEE人工智能与系统工程国际学术会议、IEEE智能系统与知识工程国际学术会议、中国PMO大会、中国国际智能驾驶汽车电子关键技术论坛、焉知汽车年会等会议发表中英文专题学术及行业报告并多次接受《齐鲁晚报》、《中国汽车报》、《搜狐汽车》等媒体采访。程增木与英飞凌半导体公司、安富利半导体、恩智浦半导体公司等多家公司进行深度合作,发布多篇技术文章及专业技术讲解视频。