FPGA与GPU计算存储加速对比:单位功耗性能考量因素.docx

上传人:lao****ou 文档编号:947286 上传时间:2024-08-01 格式:DOCX 页数:5 大小:91.17KB
下载 相关 举报
FPGA与GPU计算存储加速对比:单位功耗性能考量因素.docx_第1页
第1页 / 共5页
FPGA与GPU计算存储加速对比:单位功耗性能考量因素.docx_第2页
第2页 / 共5页
FPGA与GPU计算存储加速对比:单位功耗性能考量因素.docx_第3页
第3页 / 共5页
FPGA与GPU计算存储加速对比:单位功耗性能考量因素.docx_第4页
第4页 / 共5页
FPGA与GPU计算存储加速对比:单位功耗性能考量因素.docx_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《FPGA与GPU计算存储加速对比:单位功耗性能考量因素.docx》由会员分享,可在线阅读,更多相关《FPGA与GPU计算存储加速对比:单位功耗性能考量因素.docx(5页珍藏版)》请在第一文库网上搜索。

1、FPGA与GPU计算存储加速对比:单位功耗性能考量因素为了提升计算基础设施的性能,并紧跟数据分析与AI不断攀升的需求,众多企业将硬性加速视为主要的解决方案。在大多数情况下,先进的可编程硬件(主要是指GPU和FPGA)是加速的主要方式。通过使用这种先进的硬件,企业正在赢得计算优势;然而,对于编程难度,他们仍然存在合理的担忧。图1:分析/AI流水线组件硬件制造商正在将加速方法应用于计算存储,这是专门设计用于包含内嵌计算元素的存储。这种方法已经被证明可以为分析和AI应用提供优异的性能(图1)。使用或者不使用机受辅助的分析以及验证,都可以借助计算存储器件进行加速。这些器件提供了一个关键的优势,使得成本

2、高昂的计算被卸载到存储器件上,而不必在服务器CPU上完成。与标准的存储/CPU方法相比,通过计算存储获得的优势包括:1借助应用专用编程定制可编程硬件,获得更高性能2 .将计算任务从服务器卸载到存储器件,释放CPU资源3 .数据与计算共址,降低数据传输需求这种新颖的方法前景光明。不过,您应根据具体用例评估这种方法,考量性能、成本、功耗和易用性。性价比和单位功耗性能在选择加速硬件评估时,占据主要比率。在本文中,我们将研讨单位功耗性能(另一篇文章则专门研讨性价比)。计算存储功耗比较3种系统在这个场景中,我们将比较以CSV数据读取用例为主的三种工具:英伟达GPUDirect存储和RA1DS存储,以及基

3、于赛灵思技术的三星SmartSSD存储。CSV读取在计算密集型流水线中起着重要的作用(参见图1)O在下文中,我们将性能定义成CSV的处理速率,或处理“带宽”。我们先快速回顾一下三种系统的运行方式。英伟达GPUDirect存储 端到端满足分析和AI需求 将GPU用作计算单元,紧贴基于NVMe的存储器件布局(GPUDireCt) 使用CUDA进行编程(RAPIDS)英伟达用其CSV数据读取技术衡量相对于标准SSD的性能提升。结果如图1所示。使用1到8个加速器时,对应的吞吐量是4到23GBso三星SmartSSD驱动器 将赛灵思FPGA用作计算单元 与存储逻辑内嵌驻留在同一个内部PCIe互联上 通过

4、编程在存储平台上开展运算赛灵思数据分析解决方案合作伙伴Bigstream与三星合作,为ApacheSpark设计加速器,包括用于CSV和Parquet处理的IP。SmartSSD的测试使用单机模式的CSV解析引擎,以便开展比较。结果如图2所示,使用1到12个加速器时,对应的吞吐量是4到23GBs,同时也给出英伟达的结果(使用1到8个加速器)。请注意,本讨论中的所有结果都按X轴上的加速器数量进行参数化。这些结果令人振奋,但在选择您的解决方案时,请务必将功耗情况纳入考虑。SmartSSDBandwidthResu1tsforCSVParsing#Acce1eratorsKEYSmoftSSDNV1

5、d1o-GOSNga-RAPoS图2:SmartSSD驱动器的CSV解析性能结果单位功耗性能比较图3显示了将功耗考虑在内后的分析结果。它们代表单位功耗达到的性能水平,根据上述讨论中引用的相关材料,给出了以下假设:Tes1aV1OOGPU:最大功耗200瓦SmartSSD驱动器FPG:最大功耗30瓦BandwidthperWattComparison0.I234S678#Acce1eratorsKEYsmartssNvidia-GUSNvtdia-WAMUS图3:CSV解析的每瓦功耗带宽比较在这个场景下,计算表明,在全部使用8个加速器的情况下,SmartSSD的单位功耗性能比GPUDirectS

6、torage高25倍。FPGA与GPU对比:有关单位功耗性能的最终思考计算存储的优势在于能增强数据分析和AI应用的性能。然而,要让这种方法具备可实际部署的能力和实用性,就必须在评估时将功耗纳入考虑。针对用于CSV数据解析的两种不同的计算存储方法,我们已经提出按功耗参数化的吞吐量性能曲线。结果显示,在使用相似数量的加速器进行比较时,SmartSSD驱动器的单位功耗性能优于GPUDirect存储方法。GPUDirect是英伟达通过NVIDIADGX-2应用平台提供的研究系统。三星SmartSSD驱动器是一种可部署的量产型PCIe可插拔平台,现在已经通过赛灵思及分销商供货。如需了解更多信息,请查看:有关Bigstream与SmartSSD计算存储器件结合使用,加速大数据和数据分析的电子书。Bigstream硬件加速pacheSPark解决方案。有关使用三星SmartSSD驱动器给工作负载带来优势的三星SmartSSD页面。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 应用文档 > 工作总结

copyright@ 2008-2022 001doc.com网站版权所有   

经营许可证编号:宁ICP备2022001085号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



客服