云服务、OEM 借助 NVIDIA AI让AI训练更上层楼.docx

上传人:lao****ou 文档编号:948712 上传时间:2024-08-01 格式:DOCX 页数:4 大小:75.83KB
下载 相关 举报
云服务、OEM 借助 NVIDIA AI让AI训练更上层楼.docx_第1页
第1页 / 共4页
云服务、OEM 借助 NVIDIA AI让AI训练更上层楼.docx_第2页
第2页 / 共4页
云服务、OEM 借助 NVIDIA AI让AI训练更上层楼.docx_第3页
第3页 / 共4页
云服务、OEM 借助 NVIDIA AI让AI训练更上层楼.docx_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《云服务、OEM 借助 NVIDIA AI让AI训练更上层楼.docx》由会员分享,可在线阅读,更多相关《云服务、OEM 借助 NVIDIA AI让AI训练更上层楼.docx(4页珍藏版)》请在第一文库网上搜索。

1、云服务、OEM借助NVIDIAA1让A1训练更上层楼借助NVIDIAAI,戴尔、浪潮、MicrosoftAzure和Supermicro在今天发布的新M1Pea承准测试中创下快函I1练AI模型的记录。看看谁刚刚在快速训练AI模型方面创下新速度记录:戴尔科技、浪潮、SUPermiCrO和在M1Perf基准测试中首次亮相的Azure均在使用NVIDIAAI0在今天宣布的M1Perf训练1.1结果中,NV1D1A平台在所有八个热门工作负载中都创下了记录。NVIDIAA1FASTESTTOTRAINASetsA11RecordsandOn1yP1atformtoSubmitAcros;TimetoTr

2、ain(1owerisBetter)图示:在新一轮的测试中,NVIDIAAI训练所有模型的速度都快于替代方案。NVIDIAA1OOTensorCoreGPU提供了最出色每芯片性能,Se1ene是NV1DIA内部基于模块化NVIDIADGXSUPerPoD架构构建的A1超级计算机,借助NV1D1AInfiniBand网络和NV1D1A软件栈进行扩展,AIoo在SeIene上实现了最快的A1训练速度。NVIDIAA1FASTESTPER-CHIPSetsAURecordsandOn1yP1atformtoSubmiRe1ativeRefChipPerformanceMMM505110.81SPdZ

3、neUUoNdnPKRTD1AMMaskRCNNSSDResNet-W1.1测试中均实现最好的每图示:NVIDIAA1OOGPU在所有八项M1Perf芯片训练性能。云服务更上一层楼根据最新结果,在训练AI模型方面,Azure的NDmA1OOv4实例的速度遥遥领先。它运行了新一轮的每项测试,扩展到多达2,048个A1OOGPUoAzure不仅展示了出色性能,而且在美国的六个地区,现在所有人都可以租借和使用其出色性能。AI训练是一项需要大量投入的大型工作。NVIDIA希望用户借助他们选择的服务或系统以创纪录的速度训练模型。因此,NV1DIA将NVIDIAAI与面向云服务、主机托管服务、企业和科学计

4、算中心的产品相结合。服务器制造商各显身手在OEM中,浪潮凭借其八路GPU服务器NF5688M6和NF5488A5液冷服务器在单节点性能方面创下了最多记录。戴尔和Supermicro在四路A1OOGPU系统上创下了记录。共有10家NVIDIA合作伙伴提交了本轮测试结果,其中包含8家OEM和2家云服务提供商。它们占所有提交的90%以上。这是NVIDIA生态系统在M1Perf训练测试中的第五次亮相,也是到目前为止最出色的亮相。NVID1A的合作伙伴之所以积极参与,是因为他们知道M1Perf是唯一符合行业标准、经过同行评审的AI训练和推理基准测试。对于评估AI平台和供应商的客户来说,这是一个有价值的工

5、具。为速度认证的服务器百度PaddIePaddie、戴尔科技、富士通、技嘉科技、慧与、浪潮、联想和Supermicro提交了基于本地数据中心的结果(单节点和多节点任务)。NVID1A几乎所有的OEM合作伙伴都在NVIDIA认证系统上运行了测试,NVIDIA为需要加速让算的企业客户验证了服务器。提交的范围展示了NVIDTA平台的广度和成熟度,该平台为各种规模的企业提供最佳的解决方案。既快速又灵活NVIDIAAI是唯一用于提交所有基准测试和用例的平台参与者,这展示了其通用性和高性能。快速灵活的系统提供客户所需的生产力,以加快他们的工作速度。AI训练基准测试涵盖当今最热门的八个AI工作负载和场景,例

6、如计算机视觉、自然语言处理、推荐系统、增强学习等。M1Perf测试透明、客观,因此用户可以依靠结果做出明智的购买决策。该行业基准测试组织成立于2018年5月,得到阿里巴巴、ARM.Goog1e.InteI和NVIDIA等数十家行业领先公司的支持。三年内加速20倍回顾过去,数据显示,仅在过去18个月,NVIDIAA1OOGPU的性能就提升了5倍以上。这要归功于软件的持续创新,这也是NVn)IA目前工作的重心。自从三年前M1Perf测试首次亮相,NVIDIA的性能提高了20倍以上。这种大规模加速源于NV1D1A在全栈GPU、网络、系统和软件方面取得的进步。2oxmorePerforaaancein

7、3,NVIDIAA1De1iversContinuousGainsWithSWandAt-Sce图示:NVIDIAAI在三年内实现了20倍以上的改进。持续改进软件NVIDIA的新进展来自多项软件改进。例如,借助一类新的内存复制操作,NV1D1A在针对医学成像的3D-UNet基准测试中实现2.5倍的操作加速。得益于微调GPU以进行并行处理的方式,NVID1A在针对物体检测的MaskR-CNN测试中实现10%的速度提升,而在针对推荐系统的测试中实现了27%的提升。NVIDIA只是重叠了独立操作,这种技术尤其适合跨多个GPU运行的作业。NVID1A扩展了CUDA图形的使用范围,尽可能减少与主机CPU的通信。得益于此,NV1DIA在针对图像分类的ResNet-50基准测试中实现了6%的性能提升。NV1DIA在NCC1上实施了两种新技术。NCC1是NV1DIA的库,用于优化GPU之间的通信。对于BERT等大型语言模型,这样可以将结果加速高达5%o利用NVIDIA工作结果NVIDIA使用的所有软件均在M1Perf仓库提供,因此每个人都可以获得NV1D1A的出色结果。NV1DiA不断将这些优化整合到NGC(NVID1A的GPU应用程序软件中心)上的容器。它是全栈平台的一部分,已在新的行业基准测试中得到验证,可从各种合作伙伴处获得,能够处理当今真正的AI作业。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 应用文档 > 工作总结

copyright@ 2008-2022 001doc.com网站版权所有   

经营许可证编号:宁ICP备2022001085号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



客服