最像人脑的AI芯片来了你的车子以后会有自己的想

作者:ag8亚洲游戏 | 2019-12-13 21:52

  原标题:最像人脑的AI芯片来了,你的车子以后会有自己的想法?! 硬核时间

  这里面有 Mobileye 这样的行业先驱,有英伟达这样的跨界巨头,有特斯拉这样的别样车厂,还有地平线这样的国内新锐企业。

  然而,我们也不应该忽略一些原本在芯片领域赫赫有名的面孔,比如英特尔——虽然早在 2017 年就收购了Mobileye,但这并不影响英特尔工程师们对自动驾驶的独特追求。

  目前我们见到的自动驾驶芯片,本质上依然没有脱离一台计算机的基本结构,比如 CPU/GPU/DRAM 这些常见于你我桌上电脑、掌上手机的零件。而一台计算机在面对自动驾驶计算的时候,它的工作模式和人类司机的大脑相比是很不一样的。

  举个例子吧,特斯拉新一代 Autopilot 硬件的功耗,官方描述是 250W 每英里,也就是说自动驾驶硬件在开启状态下会一直处于全速运行。但是人类司机并不会一直烧脑式驾驶,在自己熟稔的、交通状况良好的路段上,人类大脑的负担会明显更低。

  上图这一坨东西叫做 Pohoiki Beach,主板里面密密麻麻的芯片叫做Loihi(跟我用粤语读一次,老嗨),来自于当地时间 15 号在底特律举行的2019 DARPA 电子复兴计划峰会。

  电动星球注:DARPA,全称DefenseAdvanced Research Projects Agency,即美国国防高级研究计划局,是美国国防部属下的一个行政机构,负责研发用于军事用途的高新科技。成立于 1958 年的 DARPA,一开始主要是为了应对苏联 1957 年人造地球卫星成功发射而设立的部门。

  与这个世界上所有的硅芯片类似,Loihi 芯片的基本构成依然是晶体管。但是在 Loihi 里面,晶体管的工作形式并非传统的逻辑门架构,Loihi 的计算原理也并非传统计算机恪守数十年的冯诺依曼原理,而是以更接近人脑架构的神经元方式计算。

  电动星球注:冯·诺依曼教授提出过现代电子计算机的三大原理,分别是1. 计算机由控制器、运算器、存储器、输入设备、输出设备五大部分组成;2.程序和数据以二进制代码形式不加区别地存放在存储器中,存放位置由地址确定;3. 控制器根据存放在存储器中地指令序列(程序)进行工作,并由一个程序计数器控制指令地执行。控制器具有判断能力,能根据计算结果选择不同的工作流程。

  冯诺依曼架构虽然奠定了半个多世纪的电子计算机芯片基本框架,但这个架构也有其自身的瓶颈,那就是在处理器性能飞速发展的今天,缓存的读写速度出现了跟不上处理器运行速度的瓶颈——这个瓶颈就叫冯诺依曼瓶颈。

  当然,我们无法真正的用硅元素「造」出一个神经元,Loihi 芯片的基本组成形式依然是晶体管,只是 Loihi 芯片内置晶体管的工作方式更接近于大脑神经元。64 个 Loihi 芯片一共包含了接近 1320 亿个硅晶体管,与之相比,英伟达 RTX 2080Ti GPU 内置晶体管数量为 186 亿个。

  在 Pohoiki Beach 系统中,基于 14 纳米工艺打造的每块 Loihi 芯片可以模拟 13 万个硅神经元,以及 1.3 亿个硅神经突触。64 个 Loihi 芯片互联就是 830 万个神经元,已经相当于一个小老鼠大脑内所含有的神经元总量。

  英特尔的目标远不止于此,今年年底即将推出的 Pohoiki Spring 系统会将 Loihi 芯片的性能发挥到极致,最多可以叠加 768 颗芯片,也就是模拟 1 亿个神经元,相当于一只未成年小猫的大脑神经元数量。

  虽然 Pohoiki Beach 系统的神经元总量和人脑的 860 亿个神经元比起来还有很大的一段距离,但这并不妨碍它成为目前人类神经拟态计算的新里程碑。2015 年我国浙江大学研发的「达尔文」芯片是当时比较先进的神经拟态计算芯片,内置的硅神经元也才 2048 个。

  在 2017 年 9 月份,Loihi 芯片刚发布的时候,英特尔专门为它打造了一个视频宣传片:

  视频里面充斥着英特尔对 Loihi,乃至神经拟态芯片光辉未来的期望——可是为什么呢?

  当人脑的神经元接收到信号的时候,神经元树突上的电位差会轻微升高,这个反应被称为神经元突触的激发。如果对该神经元的刺激达到一定阈值,就会产生动作电位(actional potential),产生动作电位的过程被称为放电(discharge)。

  我们大脑产生和传递信息的原理,就隐藏在神经元之间的放电反应之中,比如放电的频率,放电的持久时间,放电反应中不同的电压等等。

  与电子计算机芯片中使用的逻辑门不一样,大脑神经元只在接收到脉冲信号时才会产生动作电位并放射生物电脉冲。也就是说,大脑神经元的计算方式,在处理任务的时候会明显更高效。

  最终的结果就是,大脑的功耗理论上会比同样运算能力的电子计算机低得多——实际上,作为人类文明的基石,人脑的「功耗」仅为 20W。

  电动星球注:我们一开始认为 20W 这个结论是以讹传讹,然后我们在arXiv一篇探讨深度学习功耗的论文(arXiv 编号 1602.04019)的一处引用中找到了这个数字的根本出处——德国海德堡大学(1386 年创立,德国最古老的大学)Karlheinz Meier 教授的一项研究。

  电动星球再注:arXiv 是目前世界上最大的免费自然科学论文及其预印本阅读和交流平台,始创于 1991 年,目前由康奈尔大学管理。

  如果不是铁证如山,相信很多人难以相信大脑的能耗如此之低——所以基于硅神经元打造的类人脑神经拟态芯片也能达到这样高的能耗比吗?

  滑铁卢大学从事人工智能研究的教授 Chris Eliasmith 是 Loihi 芯片和 Pohoiki Beach 的首批合作使用者。根据 Chris 教授的实验室数据,同样实时运行一个深度学习模型并保持相同运算速度的情况下,Loihi 芯片的综合能耗水平仅为 GPU 的 109 分之一(相关研究成果在 arXiv 上可查论文,编号1812.01739),CPU 的 23.2 分之一。

  电动星球注:滑铁卢大学位于加拿大安大略省西南部滑铁卢市,创建于 1957 年,计算机科学专业在 2017 年名列 USNEWS 世界大学排名第 18 位。

  而当 Chris 教授将深度学习模型的规模扩大 50 倍之后,Poihiki Beach 在保持相同学习速度的基础上,功耗只增加了 30%,而能保持速度的传统智能芯片功耗增加了 5 倍。

  考虑到上文提及的 64 核心 Poihiki Beach 系统一共内置了 1320 亿个晶体管,这样的功耗水平实在是低得恐怖。

  我们算 1+1 和算 76x89 的时候,思考的速度是差不多的,因为这两个算式的算法我们都知道(就像深度学习模型的训练)——但你算 100 道 1+1 级别的算术题,和你算 100 道 76x89 级别的算术题之后,你肚子饿的程度和你精神疲惫的程度,不会相差太远。

  而神经元拟态计算,乃至几乎所有的神经网络计算,都是在特定的环境下运行的——这个环境叫矩阵运算。我们曾经在4个月之前的文章里面讨论过矩阵运算的基本原理,这里不详细展开,感兴趣的朋友可以在公众号后台回复「TPU」查看原文。

  针对神经网络优化的芯片,绝大部分都是在矩阵运算方面有针对性优化的,所以其他神经网络芯片,比如谷歌的 TPU ,在深度学习方面都会比传统的CPU 和 GPU 能耗比更强——只是没有 Loihi 芯片这么出众而已。

  举个例子,车载电子元件的工作温度要求一般在-40℃~55℃,更高的标准甚至会将上限设置在 110℃。也就是说,电子元件需要在极高的温度范围内保持正常的性能水平和质量水准,这就需要芯片厂商对每一代工艺做大量的优化和试验。

  比如英伟达的 Drive PX 系列在改名为 AGX 系列的同时,也经受了 ASIL-D 级别标准的认定。黄仁勋在 GTC 大会上面的原话是「这个过程大概要一年多」。

  为了适应车载级别的温度要求,功耗为 250W 的特斯拉 Autopilot 硬件 3.0 上面使用了复杂的水冷散热,功耗达到 500W 的英伟达 Drive AGX Pegasus 甚至根本没有车企敢用。

  然而我们可以看一下在 Chris 教授论文里面,Loihi 芯片的功耗表现:

  最大的差距体现在 Running,也就是运行中的功耗比较里,Loihi 以0.11W的功耗就可以达到英伟达 Quadro K4000 专业级 GPU 在37.83W功耗下同样的 AI 性能——0.11W 的功耗水平,意味着 Loihi 芯片根本不需要主动散热(就像我们的脑壳子也没有进化出一个风扇),省略了大量的结构成本。

  可惜,目前 Loihi 芯片的成本和工艺依然是一个短板,14 纳米工艺下,英特尔需要极大量的芯片叠加才足以构建不到人脑万分之一的神经元矩阵。所以 Loihi 芯片现阶段的主要应用,还是在于智能义肢,或者是深度模型训练。

  1960 年,美国医学博士 Jack E.Steele 根据古希腊语和拉丁文里面「生命」共同的词根「bio」和表示性质的「nic」词根,创造出「bionic」,也就是仿生学(仿生学这一中文词汇来自于大陆 1963 年的翻译)。

  但人类应用仿生学的历史早已有之。大禹治水时期,人们模仿鱼类在水中自由游动的特性,在船尾造木桨,这就是世界上最早的橹和舵。《韩非子》中记载的鲁班以竹木作鸟「成而飞之,三日不下」,这是世界上最早的人造飞行器记录。

  人类的生产力在不断提高,野心也在不断提高,最终就是人越来越懒,什么都不希望自己干,甚至于思考本身,都希望找到代劳者。半个世纪以来的电子计算机,便是人类对终极仿生学追求的缩影——如果能造一个大脑就好了。

  无论是你我手中的电脑,或者是 Model 3 里面装着的 Autopilot 硬件,它们都只是以科技的手段实现了大脑的「运算」能力,而并未真正发挥大脑的优势。

  依照大脑结构依葫芦画瓢的英特尔新芯片,会是自动驾驶领域尚未升起的朝阳吗?由此延伸开去,它会是人类真正掌握「思考」这一命题的普罗米修斯吗?


ag8亚洲游戏