新知一下
海量新知
6 5 2 3 1 9 7

【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜

RT-Thread | 小而美的物联网操作系统 2022/09/23 21:13

嵌入式 AI

AI 简报 20220923 期

1. 炸响平地惊「雷」,自动驾驶公司能否接下「雷神」之锤

原文:

https://mp.weixin.qq.com/s/NygDWyv26ILU1mcdYJHngQ

9 月 20 日,NVIDIA 英伟达以线上形式召开秋季 GTC 2022 大会,在会前媒体沟通会上宣布了与国内的自动驾驶公司轻舟智航,以及国内新势力造车品牌小鹏与极氪的合作

轻舟智航作为本次英伟达全球发布会上 唯一一家 搭载 NVIDIA DRIVE Orin 实现 L4 级别 Robotaxi 车队部署的公司,标志着轻舟智航与英伟达自去年达成合作以来的 首个成果落地 ,有力推进了 L4 级自动驾驶方案向更符合车规标准的方向发展。轻舟智航也携手 T3 出行在 9 月联合启动 Robotaxi 在苏州的公开运营,为市民提供安全、高效的接驳服务。

英伟达汽车事业部总经理刘通也表示,Orin 已经成为行业打造先进自动驾驶系统的首选计算平台,他们热切期盼与广大合作伙伴共同为用户带来极致的体验。同时,他们也非常兴奋的看到轻舟智航不仅高效地完成了车规级部署,还凭借着领先的技术和数据闭环能力实现了算力资源的最大化利用。

新知达人, 【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜

而英伟达的下一代芯片 Thor 算力达到 2000 TOPS,是目前 DRIVE Orin 芯片的 8 倍,此前需要 Orin+8155 或 8295 搭配,现在则只需要一颗 Thor 芯片就可以代替。既推进了中央控制器在量产车上的进度,又降低了整车硬件以及系统设计的成本,也可以支持高级别自动驾驶,预计将在 2024-2025 年实现量产。

有消息称,目前和英伟达达成合作的轻舟智航、小鹏与极氪也将率先拿到 Thor 芯片进行早期测试,智能电动车的时代,想必会因「雷神」的到来发生格局上的变化。

新知达人, 【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜

2. 新型AI芯片其能效或是替代品的两倍

原文:https://mp.weixin.qq.com/s/3omLn0ZmA-twWY9oFY_jkA

在软件和硅中复制人脑是人工智能(AI)研究的长期目标。虽然神经形态芯片在能够同时运行多个计算方面取得了重大进展,并且既能计算也能存储数据,但它们还远未达到模拟大脑的能源效率。

人工智能计算是非常耗能的,但所消耗的能量大部分不是计算本身。能量密集型部分是在AI芯片内的内存和计算单元之间移动数据。为了解决这个问题,一组研究人员开发了一种新的内存计算(CIM)芯片原型,消除了这种分离的需要。他们在8月17日发表在《自然》杂志上的论文中声称,其原型展示了现有人工智能平台效率的两倍。之所以称为NeuRRAM,是因为它使用一种称为电阻式随机存取存储器(RRAM)的RAM,这种48核RRAM-CIM硬件支持多种神经网络模型和架构。

该论文的第一作者、斯坦福大学研究员Weier Wan表示,与传统内存相比,RRAM有很多优点。其中之一是在同一硅片区域内具有更高的容量,从而可以实现更大的AI模型。它也是非易失性的,意味着没有电源泄漏。他补充说,这使得基于RRAM的芯片成为边缘工作负载的理想选择。研究人员设想,NeuRRAM芯片可以在低功耗的边缘设备上有效地处理一系列复杂的人工智能应用,而不依赖于与云的网络连接。

为了设计NeuRRAM,团队必须权衡效率、多功能性和准确性,而不牺牲其中任何一项。Wan说:“主要创新是我们使用了一种新型的模数转换方案,因为这被认为是CIM芯片能源效率的主要瓶颈。我们发明了一种新的方案,它是基于感应电压,而以前的方案是基于感应电流。电压模式感应还允许在单个计算周期内提高RRAM阵列的并行性。”

他们还探索了一些新的体系结构,如可转置神经突触阵列(TNSA),以灵活地控制数据流方向。Wan解释道:“为了精确性,关键是算法和硬件协同设计。这基本上允许我们直接在这些AI模型中建模硬件特征。”这反过来又允许算法适应硬件非理想性并保持精确性。换言之,Wan总结道,他们优化了整个堆栈,从设备到电路,从架构到算法,设计出一款高效、通用、准确的芯片。

新知达人, 【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜

3. 540 万元!全球第一辆会飞的“自行车”:能飞 40 分钟,却不能上路?

原文:https://mp.weixin.qq.com/s/GFLml633OxsN1tanF3-KIw

上周,美国底特律车展上亮相了全球第一款飞行自行车“XTurismo”,由日本企业 ALI Technologies(以下简称“ALI”,其母公司为 AERWINS Technologies)研发,可飞行 40 分钟,最高时速可达 100km/h……听起来,这辆“自行车”好像很不错,但就是:全球限量 200 辆,预售价 77 万美元(约人民币 540 万元)。

新知达人, 【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜

从外观上来看,XTurismo 的上半部分但更像是摩托车,共有红、蓝、黑三种颜色选择,底下共配备了六个螺旋桨。车身中央的两个大螺旋桨采用 228 马力的川崎摩托车高性能发动机以提供动力,安置在车身边缘的四个小螺旋桨也配置了电动机用以保持车身稳定。

为减轻车身重量,XTurismo 由大量轻质碳纤维部件打造而成,整车质量约 660 磅(299 千克),车长约 3.65 米,车宽为 2.4 米。芯片方面,XTurismo 搭载了瑞萨 RH-850 微控制器,其自动控制单元可增强飞行安全,可连接云的边缘计算单元则管理系统控制和软件更新。

XTurismo 的驾驶方式与摩托车类似,驾驶员可跨坐在座位上,双手握住把手控制飞行速度和方向。据 ALI 官方介绍,XTurismo 可在距离地面 2.4 米的高度上飞行,并在充满电和燃料的情况下可飞行约 40 分钟。

不过,XTurismo 的最大载荷只有 100kg,所以基本上不能另外载人。此外,XTurismo 驾驶时的噪音也比较大。

网友:人生新目标,努力赚钱买辆自行车

4. 天数智芯GPU芯片天垓100完成与浪潮AIStation适配认证,高效释放AI算力加速AI应用落地

原文:https://www.sino-manager.com/288962.html

上海天数智芯半导体有限公司(以下简称"天数智芯")的云端训练通用GPU芯片天垓100与浪潮AIStation智能业务生产创新平台完成兼容性适配认证,将为自动驾驶、智慧城市、智慧金融、智慧医疗、智能制造等典型AI应用场景,提供兼具高性能、通用性和灵活性的AI计算加速方案。

天数智芯是国内领先的通用GPU高端芯片及超级算力系统提供商。其天垓100 GPU芯片采用7纳米制程工艺和2.5D CoWoS晶圆封装技术,集成240亿晶体管,支持多精度数据类型标准或混合训练,提供片间互联扩展,AI算力密度与能效比业界领先。当前,天垓100已支撑近百个客户在人工智能领域进行超过两百个不同种类模型训练,ResNet50、SSD、BERT等骨干网络模型的性能比肩国际市场主流产品。此外,天垓100还广泛支持传统机器学习、数学运算、加解密及数字信号处理等领域,已适配X86、Arm等各种类型CPU架构。

新知达人, 【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜

天数智芯天垓100芯片

本次适配认证测试完成了ResNet、BERT、Yolo、VGG、MMDetection等典型深度学习算法的验证,覆盖计算机视觉、智能文本处理等典型场景。测试结果显示,运行在浪潮AI服务器上的天垓100 GPU芯片与浪潮AIStation平台在AI计算性能、兼容性和稳定性等均达到优异。借助浪潮AIStation平台优秀的算力调控能力,行业客户能够灵活使用和拓展天垓100的算力,并且达到与业界先进GPU相当的训练性能和扩展性,满足关键性AI应用需求。

5. 车圈新卖点8155背后,汽车智能化竞争已踩下油门 | 幂集创新

原文:https://mp.weixin.qq.com/s/XDSSdeNSLDqJtSAQ563dpQ

汽车的卖点,正在悄然向 AI创新 倾斜。落地到产品,就是智能车的方方面面。

且看车圈近来最热议题成都车展,连宝马沃尔沃这样老牌高端车企,都把传统汽车看重的设计感、动力性之类先放到了一边。

基本上是开口一个“智能体验”,闭口一个“AI芯片”。

这不,起码在最为直观的车机上,甭管是新势力还是传统车企,那叫一个卷出了花儿。

这厢宝马奔驰都在座舱内搞上了大连屏。

新知达人, 【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜

可以说,在这么一场A级大型车展上,“智能化”着实已经成了厂商们比拼的头号亮点。

其中,又以“智能座舱”为先锋大将。

汽车智能化竞争,其实早已箭在弦上。

毕竟,当手机等电子产品在AI等前沿技术的加持之下,变得越来越智能、便捷,人们自然而然会希望在汽车这个“第三空间”之中,同样享受到智能化带来的便利。

业内就有观点认为,汽车如今已经发展到了“四个轮子+一部智能手机”的时代,谁在智能化变革中慢上一步,即使现在身位靠前,也随时可能被后来者趁机反超。

现在看来,在第一波汽车智能化的浪潮之中,走在最前面的就是智能座舱

其中缘由,还是得先回归到智能座舱 需求本身 来看。

智能座舱,本质上是AI技术给座舱带来的变革 。它的出现至少满足了人们对汽车智能化的三大想象。

其一, 交互便捷性 。对于司机而言,开车时必须确保视线不离开路面,因此交互方式必须越简洁越好,最好能用手势、表情、语音等方式搞定一切车机交互。

其二, 应用智能性 。无论是智能温控、儿童保护还是分区语音识别,本质上都是让汽车更“贴心”的功能,而且这种智能化还在席卷车上更多的装置。

其三, 车机互联能力 。包括远程智能控车、手机车载应用同步等,都是延伸智能设备边界的功能,真正做到应用之间无缝互联。

新知达人, 【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜

6. AI数据也要紧跟MLOps,那个把标注精度提高到99.99%的公司又出手了

原文:

https://mp.weixin.qq.com/s/eyHRmmJvs0IvAjGZ9SPjAA

当IT行业改变整个世界的时候,DevOps理念从大量产业实践中诞生。

如今AI也进入产业化新时代,继承者 MLOps 或者叫 AI工程化 也越发火热。

Gartner咨询公司将AI工程化列为2022年十二大战略性技术趋势,IDC则预测到2024年60%的企业将MLOps用于机器学习工作流。

新知达人, 【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜

这一波浪潮之中,算法的工程化一如既往的跑在前面,模型的自动部署、持续训练甚至AutoML都有较大进展。

与之相对的是,数据的工程化稍显落后。

对此,一直呼吁建设“以数据为中心AI”的 吴恩达 ,今年初在接受IEEE Spectrum采访时也喊出新的口号:

AI要从大数据转向高质量的小数据。

吴恩达认为,对于数据中存在的噪声,通常做法是只要量足够大就可以让算法对其做平均处理。

但这样做不仅限制了算法的能力,有些场景如工业质检、罕见病等更是根本凑不出一个大型数据集,精心标注的 高质量数据 就成了关键。

新知达人, 【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜

实际上,除了碎片场景之外,如何高效构建高质量数据集也是全行业共同面对的问题。

AI工程化的大背景下,新一代数据标注与管理方法也从实践中逐渐诞生。

云测数据,一家以“将数据标注的最高准确率提升到99.99%”而闻名的AI数据服务公司,率先推出 「面向AI工程化的新一代数据解决方案」

方案不仅包括标注数据、管理数据所需的 平台工具 ,还涉及 管理体系 以及 数据安全 ,总共三个方面。

平台工具方面,除了基础的标注工具、API集成能力,还有数据流转产线工作台和数据产能管理体系。

管理体系方面,分为人员管理和项目管理两部分。

数据安全方面,则从硬件安全、网络安全、物理安全和人员安全管理4个角度提供保障。

新知达人, 【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜

为什么是这三个方面?感兴趣的小伙伴可以阅读原文,说不定可以给你一些启发哦。

7. DeepMind用新AI超越自己:提速200倍,在所有雅达利游戏上胜过人类

原文:

https://mp.weixin.qq.com/s/fBwQHeBsfgQX_q-u9AfOCw

DeepMind又对 雅达利游戏 下手了!

这次,他们最新推出的智能体 MEME ,在效果不变的前提下,比两年前的Agent57 提速了200倍

新知达人, 【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜


Agent57,是DeepMind在2020年搞的一个智能体,史上首次在所有57个雅达利游戏中超过了人类基准表现。

但它有一个致命缺陷是效率低:需要近800亿帧的数据训练才能实现。

现在,MEME的出现完美解决了这一问题。

有网友看完表示:这就是真正的样本高效吧。

话不多说,赶紧来一睹为快吧。

Agent57,作为首个在所有雅达利游戏中超越人类基准表现的智能体,性能上已足够先进。

但问题是,要想达到这一目标,背后需要780亿帧的庞大的经验训练,这在时间和成本上都是一笔大开支。

因此,以Agent57为起点,DeepMind采用了一系列不同的策略,来实现训练效率上的提升。

他们调查了在减少数据制度时遇到的一系列不稳定因素和瓶颈,并提出了有效的解决方案,最后建立一个更加强大和高效的智能体:MEME。

新的MEME智能体主要针对Agent57的4个方面进行改善,分别是:


A.实现与罕见事件相关的学习信号的快速传播

B.在不同的价值尺度下稳定学习

C.改进神经网络结构

D.在快速变化的政策下使更新更加稳健

新知达人, 【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜


为了达到这四个目标,DeepMind采取了以下方法,与上述四点相对应。

A1.用在线网络进行引导;
A2.有公差的目标计算;
B1.损失和优先权归一化;
B2.交叉混合训练;
C1.无归一化的躯干网络;
C2.带有综合损失的共享躯干;
D.通过策略提炼的鲁棒行为。

这些方法旨在提高Agent57的数据效率,但这种效率的提高不能以牺牲终端性能为代价。

因此,为了检验经过上述步骤的智能体MEME的效率和性能,研究团队分别在2亿、10亿、200亿、900亿帧环境进行了训练。

更多有价值的信息,小伙伴可以通过一下连接来进行学习。


[1]https://arxiv.org/pdf/2209.07550.pdf
[2]https://arxiv.org/pdf/2003.13350.pdf
[3]https://www.linkedin.cn/incareer/in/stevenkapturowski

8. 【Make YOLO Great Again】YOLOv1-v7全系列大解析(输入侧篇)

原文:https://mp.weixin.qq.com/s/_ByL55P6L7WGJU-t6adKOw

【Make YOLO Great Again】YOLOv1-v7全系列大解析(Neck篇) 【Make YOLO Great Again】YOLOv1-v7全系列大解析(Head篇) 已经发布,大家可按需取用~

而本文将聚焦于YOLO系列输入侧知识的分享,希望能让江湖中的英雄豪杰获益,也希望大家提出宝贵的建议与观点,让这个栏目更加繁荣。

新知达人, 【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜

So,enjoy(与本文的BGM一起食用更佳哦):

----【目录先行】----

  1. YOLO系列中输入侧结构的特点

  2. YOLOv1 输入侧解析

  3. YOLOv2 输入侧解析

  4. YOLOv3 输入侧解析

  5. YOLOv4 输入侧解析

  6. YOLOv5 输入侧解析

  7. YOLOx 输入侧解析

  8. YOLOv6-v7 输入侧解析


9. 比标准Attention快197倍!Meta推出多头注意力机制“九头蛇”

原文:

https://mp.weixin.qq.com/s/ZZQ-fuf6M-xF_sixX50sMw

尽管Transformer已经开始在诸多视觉任务上“大展身手”,但还有一个问题。

那就是在处理 大图像 上计算比较费劲。

比如面对一个1080p的图时,它会有超过60%的计算量都耗费在了创建和应用注意矩阵上。

究其原因,主要是因为自注意力头的数量是token的平方,而token的数量又与图形大小呈二次方的关系。

那能怎么办呢?


好消息是——

现在Meta捣鼓出了一种多头注意力操作方法,可以做到足足比标准注意力快197倍!

而且在提高计算速度的同时,它也不会牺牲准确率,有时甚至还能将准确率提高1-2个点。

新知达人, 【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜

论文地址:https://arxiv.org/abs/2209.07484


这个方法名叫Hydra Attention,主要针对Vision Transformer。(“Hydra”有“九头蛇”之义,来自希腊神话。)

Hydra Attention的思路源于线性注意力中的一种有点矛盾的点:

使用标准的多头自注意力,再向模型中添加更多头可以保持计算量不变。

而在线性注意力中改变操作顺序后,增加更多的头实际上还会降低层的计算成本。

于是,作者通过将模型中的注意力头数量设置成特征(feature)数,创建出一个token和feature的计算都是线性的注意力模块,从而把上述特性发挥到极致。

具体来说:

新知达人, 【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜


当标准自注意力头是token数的平方(O(T2D))时,通过使用可分解核(decomposable kernel),我们重新安排操作顺序,让注意力头的数量变为特征D的平方。

然后再使用Hydra Trick,最大化注意力头H的数量,让H=D,最终就可以化为一个在空间和时间上的O(TD)简化操作了。


其中,Hydra Trick的依据见下图:

新知达人, 【AI简报20220923】新型AI芯片其能效或是替代品的两倍、汽车的卖点,正在悄然向AI创新倾斜



作者在ImageNet-1k上训练了具有不同头数的DeiT-B模型,包括使用标准自注意力(蓝线,基于softmax)和使用多头线性注意(红线,基于余弦相似性)的。

前者在H>96、后者在H<3时出现内存不足的情况。

当他们往模型中添加更多的头时,Softmax注意力模型的准确性似乎会崩溃,而多

头线性注意力仍可以保持一致,因此就有了上述操作。(需要注意的是,H必须除以D=768。)

更多“AI”相关内容

更多“AI”相关内容

新知精选

更多新知精选