《数据中心液冷及冷却液行业分析.docx》由会员分享,可在线阅读,更多相关《数据中心液冷及冷却液行业分析.docx(18页珍藏版)》请在第一文库网上搜索。
1、数据中心液冷及冷却液行业分析一、算力持续增加对散热技术提出新要求,液冷是有效解决方案随着人工智能、云计算、大数据以及区块链等技术的创新发展,以高速率、低时延和大连接为特点的5G通信时代到来,作为信息基础设施的数据中心及通信设备承担的计算量越来越大,对计算效率的要求也越来越高。为了应对网络处理性能的挑战,数据中心服务器及通信设备不断提升自身处理能力和集成度,带来了功率密度的节节攀升。这些变化除了带来巨额能耗问题以外,高热密度也给制冷设备和技术提出了更高要求。传统风冷技术面对高热密度场景呈现瓶颈,散热效率已经跟不上计算效率。在此背景下,液冷技术以其超高能效、超高热密度等特点引起行业的普遍关注,液冷
2、技术是解决散热压力和节能挑战的必由之路。1、算力持续增加对芯片散热要求更高,液冷是解决散热压力和节能挑战的必由之路算力持续增加促进功率密度增长,对制冷技术提出新的要求。算力的持续增加促进通讯设备性能不断提升,芯片功耗和热流密度也在持续攀升,产品每演进一代功率密度攀升3050%。当代X86平台CPU最大功耗300400W,业界最高芯片热流密度已超过120Wcm2;芯片功率密度的持续提升直接制约着芯片散热和可靠性,传统风冷散热能力越来越难以为继。芯片功率密度的攀升同时带来整柜功率密度的增长,当前最大已超过30kW机架;对机房制冷技术也提出了更高的挑战。液冷作为数据中心新兴制冷技术,被应用于解决高功
3、率密度机柜散热需求。双碳政策下数据中心PUE指标不断降低。近年来,在“双碳”政策下,数据中心PUE指标不断降低,多数地区要求电能利用效率不得超过1.25,并积极推动数据中心升级改造,更有例如北京地区,对超过规定PUE的数据中心电价进行加价。制冷系统在典型数据中心能耗占比24%,降低制冷系统能耗是降低PUE的有效方法。算力的持续增加,意味着硬件部分的能耗也在持续提升;在保证算力运转的前提下,只有通过降低数据中心辅助能源的消耗,才能达成节能目标下的PUE要求。制冷系统在典型数据中心能耗中占比达到24%以上,是数据中心辅助能源中占比最高的部分,因此,降低制冷系统能耗能够极大的促进PUE的降低。有数据
4、显示,我国数据中心的电费占数据中心运维成本的60-70%。随着服务器的加速部署,如何进一步降低能耗,实现数据中心绿色发展,成为业界关注的焦点。液冷技术能实现极佳节能效果。近年来,为了降低制冷系统电能消耗,行业内对机房制冷技术进行了持续的创新和探索。间蒸/直蒸技术通过缩短制冷链路,减少过程能量损耗实现数据中心PUE降至1.15-1.35;液冷则利用液体的高导热、高传热特性,在进一步缩短传热路径的同时充分利用自然冷源,实现了PUE小于1.25的极佳节能效果。2、风冷是最成熟冷却方案之一,但仍存在多项不足目前风冷技术是数据中心最为成熟和应用最为广泛的冷却方案之一。它通过冷/热空气通道的交替排列实现换
5、热。机架产生的热空气由机房空调(CRAC)或者机房空气处理单元(CRAH)产生的冷空气进行冷却,冷空气通过地下的通风口输送至机架间的冷空气通道。其中,CRAC采用制冷剂为媒介进行冷却,而CRAH则采用水一空气换热器对水进行冷却。在典型的风冷数据中心中,所有服务器机架均呈行排列。通过CRAH或CRAC单元冷却的空气通过地下通风通道进入数据中心房间后,扩散经过服务器,吸收服务器产生的热量后进入热风通道,从而回到CRAH或CRAC单元。因此,风冷技术会同时冷却服务器机架内的所有电子器件。风冷技术存在低密度和相对较低的散热能力的不足。这对于高性能计算(HPC)应用尤为明显。此外,风冷技术还有以下不足:
6、1)热点。由于缺乏合适的空气流量控制系统,服务器设备产生的热量和冷空气换热不均匀,容易在服务器机架之间和内部形成局部热点。因此,为了充分消除这些热点,需要对数据中心进行过度冷却,从而额外增大了能耗。2)机械能耗。在冷却过程中,很大一部分电能用于驱动风机和泵,从而实现空气和水的循环。3)环境匹配性。为了维持数据中心运行稳定,采用风冷技术的系统通常需要常年不间断运行。因此,即使在冬季,室外温度较低,也需要维持数据中心的冷却循环,不利于节能。4)占用空间大。要达到有效冷却,数据中心通常需要大量的空间来放置空调和服务器机架。图4:数据中心风冷技术结构示意图3、相较于风冷,液冷具有低能耗、高散热、低噪声
7、、低TCO等优势液冷通过液体代替空气,把热量带走。液冷是通过液体代替空气,把CPU、内存等IT发热器件产生的热量带走,就好似给服务器局部冷却、整体“淋浴”甚至全部“泡澡”。根据目前技术研究的进程,将液冷分类为了水冷和冷媒冷却。可用冷媒包括水、矿物油、电子氟化液等。液冷具有低能耗、高散热、低噪声、低TCe)等优势。液体的冷却能力是空气的Iooo3000倍。液冷技术可实现高密度、低噪音、低传热温差以及普遍自然冷却等优点,相对于风冷技术具有无法比拟的技术优势,是一种可以适用于需要大幅度提高计算能力、能源效率和部署密度等场景的优秀散热解决方案。(1)低能耗传热路径短:低温液体由CDU(冷量分配单元)直
8、接供给通讯设备内;换热效率高:液冷系统一次侧和二次侧之间通过换热器实现液液换热;一次侧和外部环境之间结合风液换热、液液换热、蒸发汽化换热三种形式,具备更优的换热效果;制冷能效高:液冷技术可实现4055C高温供液,无需压缩机冷水机组,采用室外冷却塔,可实现全年自然冷却;除制冷系统自身的能耗降低外,采用液冷散热技术有利于进一步降低芯片温度,芯片温度降低带来更高的可靠性和更低的能耗,整机能耗预计可降低约5%o(2)高散热液冷系统常用介质有去离子水、醇基溶液、氟碳类工质、矿物油或硅油等多种类型;这些液体的载热能力、导热能力和强化对流换热系数均远大于空气;因此,针对单芯片,液冷相比于风冷具有更高的散热能
9、力。同时,液冷直接将设备大部分热源热量通过循环介质带走;单板、整柜、机房整体送风需求量大幅降低,允许高功率密度设备部署;同时,在单位空间能够布置更多的ICT设备,提高数据中心空间利用率、节省用地面积。(3)低噪声液冷散热技术利用泵驱动冷却介质在系统内循环流动并进行散热,解决全部发热器件或关键高功率器件散热问题;能够降低冷却风机转速或者采用无风机设计,从而具备极佳的降噪效果,提升机房运维环境舒适性,解决噪声污染问题。(4)低TCo液冷技术具有极佳的节能效果,液冷数据中心PUE可降至1.2以下,每年可节省大量电费,能够极大的降低数据中心运行成本。相比于传统风冷,液冷散热技术的应用虽然会增加一定的初
10、期投资,但可通过降低运行成本回收投资。以规模为IOMW的数据中心为例,比较液冷方案(PUE1.15)和冷冻水方案(PUEI.35),预计2.2年左右可回收增加的基础设施初投资。通过将传统风冷、冷板式液冷和单相浸没液冷对比,浸没式液冷功率密度最高,机柜数量和占地面积最小,冷却能耗和冷却电费最低;而风冷的功率密度最低,机柜数量和占地面积最大,冷却能耗和冷却电费最高;冷板式液冷居中。图6:液冷同比风冷散热能力(2MW机房)风冷冷板式液冷浸没式液冷液冷系统通用架构:室外侧包含冷却塔、一次侧管网、一次侧冷却液;室内侧包含CDU、液冷机柜、ICT设备、二次侧管网和二次侧冷却液。按冷却原理,冷板式、浸没式和
11、喷淋式是目前液冷的3种主要部署方式。其中,浸没式和喷淋式液冷等为接触式液冷,冷却液体与发热器件直接接触。(1)浸没式液冷:浸没式液冷将IT设备发热元件全部浸没在冷却液中实现散热,根据工质是否产生相变又分为单相液冷和相变液冷。吸热后的冷却液采用风冷或水冷等方式循环冷却或者冷凝。(2)喷淋式液冷:喷淋式液冷依靠泵压或重力驱动,按发热元件需求向IT设备电路板自上而下精准喷淋冷却液,吸热的冷却液采用风冷或水冷等方式循环冷却。(3)冷板式液冷:冷板式液冷为非接触式液冷,冷却液体与发热器件不会直接接触。冷板式液冷通过流道将冷却液通往与IT设备发热元件接触的冷板将热量导出,吸热后的冷却液通过风冷或水冷等方式
12、循环冷却。接触式液冷较间接式液冷,冷却效果更优。接触式液冷与间接式液体冷却完全不同,液体制冷剂直接和电子器件接触,绝缘液体介质能够保证电子器件的绝缘。接触式液冷技术具有如下优势:1)液体比热容远高于空气,传热量大,效率高。2)节能降耗。如前面所述,采用接触式液冷技术,大幅降低冷却能耗。PUE可达1.04,无限接近理论极限值。3)提高运算设备性能和可靠性。芯片功耗的突然增加不会导致温度瞬间的大幅变化。除了服务器和冷却设备的耗电,事实上硬件维修和维护费用也是数据中心不小的成本。据估算,服务器维修和维护费用占服务器和冷却电费的一半。根据实践,在数据中心中,硬盘需要的更换频率是最高的。此外,温度每升高
13、10oC,电子器件的可靠性和寿命降低50%。因此,浸没式(接触式)液冷技术能够最大程度控制服务器温度均匀,并大幅提高运算设备性能和可靠性。4)降低风扇振动、噪声和耗能。浸没式(接触式)液冷技术完全不需要风扇,最大限度减少噪声污染源。5)提高数据中心功率密度,减小机房占地面积。按照单机柜42U容量配置,放置传统19英寸标准服务器,单机柜功率密度范围可由20kW提升至200kWo接触式液冷对氟化液纯净度、流体沸腾过程控制要求更高。1)首先,液封模块中的氟化液必须非常纯净,而且芯片与基片之间连续的焊盘在焊接过程中产生的残留物也必须清洁干净(实际操作比较困难)。否则经过长时间浸泡和相变循环,这些残留物
14、会溶解并在沸腾的过程中沉积于焊盘上。长期使用会腐蚀焊盘从而失效。2)其次,在流体沸腾冷却试验中,在芯片表面的沸腾刚刚开始时,温度波动会出现在芯片表面。在某些试验中,如果在沸腾开始前芯片已经达到期望的温度水平,在沸腾刚开始,芯片表面还没有出现大量气泡,就会出现一个显著的超高(过热)温度提高芯片的结温。3)最后,在非沸腾试验中,如果依靠氟化液自然对流冷却芯片,则会出现由于比热容偏低、散热能力不够而导致的不可接受的芯片高温。冷板式液冷成熟度最高,浸没式液冷、喷淋式液冷节能效果更优。目前,3种不同液冷方案在通信行业各有一些应用案例。其中,冷板式液冷发热器件不需接触冷却液,发展时间最早,技术成熟度较高,
15、冷板式液冷采用微通道强化换热技术具有极高的散热性能,在军用雷达、高密度数据中心、高性能电脑、动力电池以及高功率1ED散热领域均有应用,是解决大功耗设备部署、提升能效、降低制冷运行费用、降低TCO的有效应用方案;而浸没式和喷淋式液冷实现了100%液体冷却,具有更优的节能效果。浸没式液冷散热节能优势明显,在超算、高性能计算领域取得了广泛应用;喷淋式液冷公开展示的研究成果和应用实践相对较少。(1)相变浸没式液冷技术:相变式冷却系统分一体式和分体式,其组成主要包括以下几部分:冷却液、密封腔体(密封,压力一压力控制系统)、芯片散热膜模块(散热罩)、冷却模块(CDM)和室外冷源。其中,冷却模块又由管道、液
16、汽换热器、循环泵、储液器和阀门等组成。室外冷源包括风冷式机组、水冷式机组、水喷淋冷却系统及闭式冷却塔等。相变浸没式液冷方案是数据中心高效和极具前景的冷却方案。即使服务器在全负荷的状态下运行,服务器整体温度仍能够维持在合适的范围内。(2)单相浸没式液冷技术:单相液冷类技术属于浸没式液冷前沿技术,该技术克服了以往IT设备运行环境的限制IT设备的电子器件连同设备完全浸没在特殊液体中,在液相环境下稳定运行,并形成完全封闭的导热回路。与传统的风冷式和冷板式液冷技术相比,其性能大幅提高,几乎完全免除湿度、灰尘和振动的影响,优化了服务器的运行环境,延长了设备的寿命,安全可靠,无噪声,制冷效率高,节能环保。尽管非相变类液冷技术的前景较好,但由于其对IT设备的要求较高,成本高昂,仍没有得到普及。目前该技术主要应用于散热性能要求极高的超算领域,但是,随着数据中心散热要求的提高,其势必会成为未来数据中心主流的散热技术之一。二、液冷数据中心建设加速