亚马逊“云计算春晚”大爆猛料:采用GH200超级芯片、发布聊天机器人
2023-11-30 15:55
当地时间周一(11月27日),有“云计算春晚”之称、为期四天的“re:Invent”在美国拉斯维加斯盛大开启。周二,亚马逊与其云计算部门AWS都各自公布了重磅消息。
在AWS这边,其发布了升级版的自研处理器芯片“Graviton4”。新闻稿称,与上一代Graviton3相比,其计算性能提高了30%,内核增加了50%,内存带宽增加了75%,为在亚马逊EC2中运行的云工作负载提供最佳的性价比和能效。
Graviton4 和 Trainium
AWS还发布了面向人工智能系统的升级款加速器芯片“Trainium2”。介绍称,其训练速度是上一代Trainium1的四倍,并且能够组合在超过10万个芯片的EC2 UltraCluster中,“使基础模型(FM)和大型语言模型(LLM)的训练只需极少的时间,同时能效将提升至2倍。”
据了解,Trainium2将于2024年投入应用,可能取代AWS中部分英伟达的AI加速器产品,但这不意味着亚马逊和英伟达分道扬镳。在会议上,英伟达CEO黄仁勋和AWS CEO Adam Selipsky一起上台,宣布两家公司“扩大战略合作关系”。
最新的合作包括,AWS将成为第一家采用英伟达GH200 Grace Hopper Superchip平台的云服务提供商,该平台可以集成32个Grace Hopper超级芯片在一个封装“GH200 NVL32”中。配备亚马逊云技术后,服务可以扩展到数千个GH200芯片。
另外,两家公司将合作在AWS上托管英伟达的多节点AI训练即服务解决方案“NVIDIA DGX 云”,它也将成为第一个采用GH200 NVL32的DGX云。两者还在Ceiba项目上进行合作,设计全球最快的、GPU驱动的AI超级计算机,英伟达计划使用它来推动下一波生成式AI的创新。
AWS还将推出三个新的Amazon EC2实例,分别为P5e、G6和G6e,三者都将由英伟达的GPU提供支持。其中,G6e特别适合使用英伟达的平台“NVIDIA Omniverse”来开发3D工作流程、构建数字孪生和其他应用程序。
除此以外,AWS CEO Adam Selipsky还发布了一款名为“Q”的聊天机器人,专门供人们在工作中使用,并且可以根据客户的业务进行定制。新闻稿称,用户可以使用Q在AWS上构建应用程序、研究最佳实例、解决错误以及获得编写新功能的帮助。