GTC CHINA 2019:黄仁勋带来了哪些“核武器”?

2019-12-20 12:22:44 来源: 杜芹
The more you buy,The more you save.

                                 ——黄仁勋

 

 

一年一度的英伟达GTC CHINA今日在苏州金鸡湖畔拉开帷幕,又见黄教主!黄仁勋登场之后便感叹到,这是迄今为止最大规模的GTC China,与会人数达到6100,较三年前的2400人增加250%。不过黄教主带来的硬核武器也没有让观众失望!拿下BAT,捆绑ARM,英伟达在AI、自动驾驶、游戏以及HPC各个领域都有更新。

随着摩尔定律的终结,GPU加速计算将成为未来的发展方向,这一点现在已得到公认。加速计算可将恰当的工具用于恰当的作业两种处理器,一个擅长顺序单线程处理;另一个擅长并行多线程处理。对此,英伟达可以实现这些加速,但前提是整个软件堆栈均已得到优化。优化之后,多GPU和多节点系统可以实现令人难以置信的性能。

黄仁勋讲到,在加速计算领域深耕25年,英伟达目前已经售出15亿块GPU,如今在使用的每块GPU都兼容CUDA,采用同一个架构。

黄仁勋在还会上宣布,TENSORFLOW现已在ARM上加速,TENSORFLOW可以说是当今世界上非常重要的HPC应用程序,广泛应用于科学研究云计算、工业和商业领域。扩展TENSORFLOW的性能是一个巨大的HPC挑战!

但现在,借助英伟达的CUDA on ARM,TENSORFLOW可以实现世界一流的性能和扩展能力。

 

汽车领域多面开花

 

1. 向自动驾驶汽车开发者开源

 

会上,英伟达还宣布,在NVIDIA GPU Cloud (NGC)容器注册上,向交通运输行业开源NVIDIA DRIVE自动驾驶汽车开发深度神经网络。

如今,NVIDIA向自动驾驶汽车开发者开源其预训练AI模型和训练代码。通过一套NVIDIA AI工具,NVIDIA生态系统内的开发者们可以自由扩展和自定义模型,从而提高其自动驾驶系统的稳健性与能力。

黄仁勋表示:“AI自动驾驶汽车是软件定义的汽车,它必须基于大量数据集才能在全球范围行驶。我们向自动驾驶汽车开发者开源我们的深度神经网络,并为他们提供先进学习工具,使他们能够根据不同的数据集对这些网络进行优化。通过这一方式,我们正在实现跨企业和国家/地区的共享学习,并保护数据所有权和隐私,最终加快全球自动驾驶汽车的落地。”

AI对于安全的自动驾驶汽车开发来说至关重要,它能够让其感知周围环境并做出实时反应,从而实现智能行驶。其核心是由数十个深度神经网络组成的,它们可以处理冗余和不同任务,以确保精确的感知、定位和路径规划。

除了开源深度神经网络之外,NVIDIA还发布了一套先进工具,使开发者可以使用自己的数据集和目标特征集自定义并增强NVIDIA的深度神经网络。这套工具使用主动学习、联邦学习和迁移学习来训练深度神经网络。

 

  • 主动学习借助AI而不是人工管理实现自动数据选择,进而提高模型精度,降低数据采集成本。

 
  • 联邦学习使企业能够与其他企业一起使用分布在不同国家的多个数据集,同时保护数据隐私和企业的知识产权。

 
  • 借助NVIDIA在自动驾驶汽车开发领域的大力投入,迁移学习使NVIDIA DRIVE客户能够加快开发其感知软件,然后基于他们自己的应用和目标能力进一步开发这些网络。

 

通过在NGC上开源AI模型和推出先进训练工具,NVIDIA强化了其端对端自动驾驶汽车的开发和部署平台。

2. 牵手滴滴,为其L4级自动驾驶汽车提供推理能力

 

滴滴在今年8月份将其自动驾驶部门升级为独立公司,并与产业链合作伙伴开展广泛合作。在本次大会上,NVIDIA宣布,滴滴将使用NVIDIA GPU和其他技术开发自动驾驶和云计算解决方案。

具体来看,滴滴将在数据中心使用NVIDIA GPU训练机器学习算法,并采用NVIDIA DRIVE™为其L4级自动驾驶汽车提供推理能力。NVIDIA DRIVE将借助多个深度神经网络融合来自各类传感器(摄像头、激光雷达、雷达等)的数据,从而实现对汽车周围环境360度全方位的理解,并规划出安全的行驶路径。
 
为了训练这些深度神经网络,滴滴将采用NVIDIA GPU数据中心服务器。在云计算方面,滴滴还将构建领先的AI基础架构,并推出计算型、渲染型和游戏型vGPU云服务器。
 
滴滴云将采用新的vGPU许可证模式,旨在为用户提供体验更佳、应用场景更丰富、效率更高、更具创新性和灵活的GPU计算云服务。目前,滴滴云已与NVIDIA等行业合作伙伴携手服务交通出行、AI、图形渲染、电子游戏及教育培训等多个领域。
 
NVIDIA自动驾驶汽车副总裁Rishi Dhall表示:“不论是在云端还是汽车中,开发安全的自动驾驶技术,端到端的AI都不可或缺。借助NVIDIA的AI技术,滴滴将能够开发更安全高效的交通运输系统,并提供丰富的云服务。”
 
3. 发布新一代汽车SoC:170亿个晶体管,算力200TOPS

黄仁勋在会上还介绍了NVIDIA于今日发布用于自动驾驶和机器人的高度先进的软件定义平台——NVIDIA DRIVE AGX Orin。该平台内置全新Orin系统级芯片。该芯片由170亿个晶体管组成,凝聚着NVIDIA团队为期四年的努力。

Orin系统级芯片集成了NVIDIA新一代GPU架构和Arm Hercules CPU内核以及全新深度学习和计算机视觉加速器,每秒可运行200万亿次计算,几乎是NVIDIA上一代Xavier系统级芯片性能的7倍。

作为一个软件定义平台,DRIVE AGX Orin能够赋力从L2级到L5级完全自动驾驶汽车开发的兼容架构平台,助力OEM开发大型复杂的软件产品系列。由于Orin和Xavier均可通过开放的CUDA、TensorRT API及各类库进行编程,因此开发者能够在一次性投资后使用跨多代的产品。

Orin可处理在自动驾驶汽车和机器人中同时运行的大量应用和深度神经网络,并且达到了ISO 26262 ASIL-D等系统安全标准。

NVIDIA创始人兼首席执行官黄仁勋表示:“打造安全的自动驾驶汽车,也许是当今社会所面临的最大计算挑战。实现自动驾驶汽车所需的投入呈指数级增长,面对复杂的开发任务,像Orin这样的可扩展、可编程、软件定义的AI平台不可或缺。”

Navigant Research首席研究分析师Sam Abuelsamid表示:“ NVIDIA对交通运输行业的长期承诺,以及其创新的端对端平台和工具,已经构成了一个广阔的生态系统。几乎每家自动驾驶汽车领域的企业,都在其计算堆栈中使用NVIDIA的解决方案。Orin可以看作是整个行业向前迈出的重要一步,它将帮助我们在这个技术不断发展的行业中书写新的篇章。”

Orin系列将包含一系列基于单一架构的配置,并将于2022年开始投产。

拿下BAT,英伟达活跃在中国AI朋友圈
 

1. 阿里巴巴380亿美元的背后推手

在今年“双十一”购物节期间,阿里巴巴创造了380亿美元的销售额,相比于去年的310亿美元,增长了近四分之一,阿里巴巴异构计算总监徐凌杰表示,能够保证了这一切都能正常运行,正是AI 的功劳。

他表示:“为了能够给用户带来良好的客户体验,我们采用NVIDIA加速计算平台大规模部署先进的AI技术,包括T4 GPU、cuBLAS、自定义混合精度和推理加速软件等” ,“通过该平台的直观搜索功能和可靠的推荐,我们能够支持比过去复杂6倍的模型,从而使点击率提高10%。相比于CPU,T4将我们最大模型的吞吐量提高了100倍。”

对于阿里巴巴和其他领先的网络零售商来说,推荐系统都是一个至关重要的应用程序。该系统可以向用户展示与其喜好相匹配的商品,从而提高点击率。而点击率在电商行业一直都是提高销售量的重要驱动力。

点击率的每一次小幅提高都会直接影响用户的体验和商家的营收。使用能够实时大规模运行的先进推荐系统模型可使点击率提高10%,目前这只能通过GPU实现。这使得NVIDIA T4 GPU能够为阿里巴巴广泛、深入的推荐模型提供加速,实现每秒处理780个查询。这远远领先于基于CPU的推理 —— 后者每秒只能处理3个查

阿里巴巴富有远见性地部署了NVIDIA的AI平台,使用NVIDIA GPU支持资源分配、模型量化和图变换三项优化策略,从而提高吞吐量和响应性。阿里巴巴还部署了NVIDIA GPU为各类系统提速,包括自动广告横幅生成、广告推荐、帮助识别假冒产品的图像处理、语言翻译以及语音识别等系统。

2. 百度推荐系统采用NVIDIA GPU

在和百度的合作上,英伟达表示百度的 AIBox 系统是 wide and deep 结构,采用NVIDIA AI平台,基于NVIDIA GPU训练TB级数据,速度比CPU更快,且采用GPU训练的成本只有 CPU 的十分之一。

100多个推荐模型将被应用在百度的众多应用中,这些模型将会每周更新,学习用户的潜在兴趣,新的条目和特征将被持续更新。

3. 赋力腾讯云游戏

腾讯游戏和NVIDIA于今日宣布了一项将电脑游戏带入云端的合作。NVIDIA的GPU技术为腾讯游戏的START云游戏服务赋力,该服务已从今年初开始进入测试阶段。START使游戏玩家可以随时随地,即使是在配置不足的设备上也能玩AAA游戏。腾讯游戏计划将扩展其云游戏产品,为数百万玩家提供与本地游戏设备一致的游戏体验。

腾讯游戏高级副总裁马晓轶表示:“NVIDIA打造了全球最强大的GPU,是GPU领域的领导者,又具有云解决方案方面的经验,这两大优势能够帮助我们将START平台扩展到数百万玩家。今天对于我们公司来说是一个新的契机,我们将进一步扩大我们在游戏市场的疆域。”

NVIDIA通过助力START平台不断扩大在云游戏领域的足迹。今年初,NVIDIA宣布与日本SoftBank和韩国LG U+公司合作开发云游戏解决方案。此外,NVIDIA还在北美和欧洲部分市场提供GeForce NOW™ 云游戏服务,为全球的游戏玩家提供最佳的专属云端电脑游戏体验。

NVIDIA和腾讯游戏还宣布成立一个游戏联合创新实验室。双方将共同探索AI在游戏、游戏引擎优化和新光照技术(包括光线追踪和光线烘焙)中的新应用。
 

树立自主机器统一平台的里程碑

 

黄仁勋还在大会上宣布,发布全新版本Isaac软件开发套件(SDK),为机器人提供更新的AI感知和仿真功能。在建立统一的机器人开发平台以实现AI、仿真和操控功能方面,Isaac SDK迈出了重要的里程碑。

 

 

Isaac SDK包括Isaac Robotics Engine(提供应用程序框架),Isaac GEM(预先构建的深度神经网络模型、算法、库、驱动程序和API),用于室内物流的参考应用程序以及Isaac Sim的第一个版本(提供导航功能)。

全新Isaac SDK可以大大加快研究人员、开发人员、初创企业和制造商开发和测试机器人的速度。它使机器人能够通过仿真获得由人工智能技术驱动的感知和训练功能,从而可以在各种环境和情况下对机器人进行测试和验证。这样一来,可以大大的节省成本。

为了加快AI机器人的开发速度,全新Isaac SDK包括各种基于摄像头的感知深度神经网络。例如对象检测、自由空间分割、3D姿态估计、2D人体姿态估计。

新版本还引入了一项重要功能——使用Isaac Sim训练机器人,并将所生成的软件部署到在现实世界中运行的真实机器人中。这有望大大加快机器人的开发速度,从而实现综合数据的训练。

另外,全新SDK也提供了多机器人仿真。这使开发人员可以将多个机器人放入仿真环境中进行测试,以便它们学会彼此相关的工作。各个机器人可以在共享的虚拟环境中移动时,运行独立版本的Isaac导航软件堆栈。

全新SDK还集成了对NVIDIA DeepStream软件的支持,该软件广泛用于处理分析功能。开发人员可以在支持机器人应用程序的边缘AI部署DeepStream和NVIDIA GPU,以实现对视频流的处理。

最后,对于已经开发了自己代码的机器人开发人员,全新SDK也能集成他们的工作,并添加了基于C编程语言的新API。这使开发人员可以将自己的软件堆栈连接到Isaac SDK,并最大程度地减少编程语言转换——为用户提供通过C API访问路由的Isaac功能。

结语
 

刚在Q3交出满意答卷的英伟达,如今游戏业务强势复苏,数据中心逐渐回暖,AI领域多面玲珑,GPU未来大有可为!

责任编辑:sophie
半导体行业观察
摩尔芯闻

热门评论