
2018年11月21日,英伟达在苏州召开了GTC CHINA 2018,会上介绍了英伟达在显卡、GPU加速、云GPU、AI计算平台、自动驾驶等领域的成果,并展示了相关产品,可谓干货满满,其中有几点值得留意。
· NVIDIA HGX-2 GPU加速平台
HGX-2 云服务器平台具有多精度计算能力,可提供无可比拟的灵活性以支持未来计算。该平台融合了高精度 FP64 和FP32,可实现精确高性能计算;同时也融合了更快速的低精度FP16 和INT8, 可实现深度学习和机器学习。HGX-2 能够提供无与伦比的计算性能。HGX-2 具备 NVIDIA NVSwitch™ 互联结构等突破性功能,将16 个 NVIDIA Tesla® V100 Tensor Core GPU 无缝连接到一起,形成一个巨型GPU,能够提供 2 千万亿次的AI 性能。HGX-2 还具有 0.5 TB 内存和 16 TB/s 总内存带宽。
NVIDIA HGX-2服务器
NVIDIA 的HGX-2 在单节点中能够提供 2 千万亿次的计算性能,与仅使用CPU 的服务器相比,它将AI 机器学习工作负载的运行速度提升近 550 倍,将AI 深度学习工作负载的运行速度提升近 300倍,将高性能计算工作负载的运行速度提升近 160 倍。
如今百度和腾讯将借助 HGX-2,为内部应用及云客户提供一系列更强大的 AI 服务;浪潮是中国首家构建HGX-2 服务器的厂商,浪潮 AI 超级服务器AGX-5 专为解决当前 AI 深度学习和高性能计算的性能扩展难题而设计;联想、华为、曙光也已宣布成为NVIDIA HGX-2 云服务器平台的合作伙伴。
· NVIDIA Turing T4
T4 基于全新NVIDIA TuringTM 架构,采用多精度 Turing Tensor Core 和全新RT Core,与加速的容器化软件堆栈相结合,提供规模空前的性能。T4 旨在满足横向扩展的公共云和企业云环境的独特需求,最大限度地提高吞吐量、利用率和用户并发性,帮助客户高效应对用户及数据爆炸式增长的问题。
小巧的 70 瓦特 T4 GPU 大致相当于一条巧克力糖的大小,可灵活适应于标准服务器或任何开放计算项目的超大规模服务器设计。服务器设计的范围可从单个 T4 GPU 直至单节点中的 20 个GPU。
T4 的多精度功能可支持 4 种不同精度等级的各类AI 工作负载,助力实现突破性的AI 性能,FP32 精度能够提供 8.1 TFLOPS,FP16 精度能够提供 65 TFLOPS,INT8 精度能够提供 130 TOPS,INT4 精度能够提供 260 TOPS。针对 AI 推理工作负载,配备 2 个 T4 GPU 的单个服务器最多可取代 54 台 CPU 服务器。针对AI 训练,配备 2 个T4 的单个服务器可取代 9 台双套接字 CPU 服务器。
· NVIDIA DRIVE AGX Xavier
新贵汽车制造商、货运公司和领先的供应商为其即将推出的自动驾驶系统平台选用 NVIDIA DRIVE AGX。Xavier 是完全汽车级别芯片,目前正在生产中。通过选择在他们的汽车上安装高性能、高能效的NVIDIA DRIVE AGX Xavier 计算系统,这些公司正朝着一个安全的交通环境努力,并为未来的道路建立强有力的合作伙伴关系。
随着电子商务带动全球货运需求并加剧卡车司机短缺的形势,自动驾驶预计将成为物流业的一大福音。在中国每天的生活中,卡车都在高速公路上运送多达 8400 万吨的货物,为中国 3000 万卡车司机带来越来越大的压力。为助力加速其发展,中国的运货公司正在采用 NVIDIA DRIVE AGX,以提供无人驾驶车辆所需的计算性能。一汽集团、AutoX、小鹏汽车和奇点汽车都选择了NVIDIA DRIVE AGX Xavier。
· NVIDIA Jetson AGX Xavier
下一代配送机器人需要在小型封装中实现大规模计算性能。包括多个高分辨率摄像头和激光雷达等的各种传感器必须感知周围世界,在复杂、动态的城市环境中进行本地化地路径规划和行驶。它们需要实时识别行人、汽车、交通信号灯、标志和其他物体并做出反应。
Jetson AGX Xavier 非常适用于此类场景。它具有高性能和高能效,能够实时处理所有这些计算任务, 让配送机器人能够安全地自主执行操作。该模块能够以每秒高达 32 万亿次的操作速度,提供强大工作站般的处理能力,其能效比其前代产品高出 10 倍,而尺寸仅有手掌大小。
目前京东、美团点评已经与英伟达展开合作。