数据中心浸没液冷中冷却液关键问题研究
本文主要讨论了数据中心的冷却技术,特别是浸没式液冷的应用及其冷却液的选择。浸没式液冷通过将电子设备完全浸入冷却液中,利用热交换和液体的传热特性来提高散热效率。文章指出,浸没式液冷在高密度数据中心中具有潜力,但面临材料兼容性、环境影响、经济成本等挑战。冷却液的选择需综合考虑热物理性能(如密度、比热容、导热率和汽化潜热)、材料兼容性和信号兼容性。碳氟类冷却液在传热性能和环保性方面具有优势,但其挥发性和环境影响需严格控制。此外,文章还讨论了浸没式液冷在低碳发展和绿色数据中心中的应用前景,强调其在提升能源效率和降低能耗方面的潜力。未来,随着技术的发展和标准的完善,浸没式液冷有望在数据中心中得到更广泛应用。
摘要
随着数据中心的功率密度持续提升,如何确保设备稳定运行并推动绿色可持续发展成为一项重要挑战。液冷技术通过有效应对机房高密度部署和局部过热问题,正在成为解决这一挑战的关键技术。本文将重点介绍浸没式液冷的两种典型应用方式,并深入探讨这两种方式下的冷却液关键性能指标及其实际应用差异,同时关注其对系统安全性和环境的影响。
关键词: 数据中心; 浸没液冷; 冷却液
0****引言
数据中心作为支撑现代经济社会发展的重要战略资源和新型基础设施,负责收集、存储、处理和分布大量数据。随着人工智能、虚拟现实和智慧城市等高密度业务的逐步扩展,数据中心面临的计算量和计算复杂度也随之显著增加。在芯片制程速度持续放缓的背景下,为了应对日益提升的处理需求,计算行业不得不通过提升芯片能力的方式进行优化,导致CPU功率从单个150瓦增长至300瓦以上,而用于图形处理单元的GPU功率甚至达到700瓦以上。对于信息通信设备而言,运行温度对其正常运行稳定性产生直接影响,因此数据中心的散热系统必须能够有效应对密度的增加。根据冷却原理的不同,目前的冷却解决方案主要可分为风冷(如基于...)和液冷两大类。风冷架构下,单个机架的最大功率可达20至30千瓦,而液冷技术则可将单个机架的功率限制提升至100千瓦以上。因此,在面对日益增长的热负荷、建筑规模受限以及高要求的节能条件下,通常需要采用液冷技术。
随着我国数据中心政策对PUE目标的收紧和对节能低碳理念的倡导,降低能耗已成为数据中心必须探索的重要课题。数据中心在运行过程中,约三分之一的能耗用于IT设备的散热,因此,降低制冷系统能耗便成为整个数据中心实现节能降耗的关键部分。液冷系统通过液体循环换热来提高冷却效率,这不仅能够显著降低数据中心的总能源消耗量,还能有效减少二氧化碳的排放量,这与我国数据中心推进低碳发展战略的目标高度契合。
数据中心的液冷系统主要包含浸没式、冷板式等多种方式。浸没式冷却方式因其高散热效率,能够显著降低数据机房的PUE值,近年来成为学界和业界关注的焦点,是数据中心液冷技术的关键分支。根据预测,全球浸没式液冷市场未来五年将以超过20%的复合年增长率增长,预计未来五年内将达到7亿美元。随着芯片密度的持续增加、复杂化的边缘计算环境以及数据中心节能减排的压力,浸没式液冷技术将继续推动相关市场的发展。
1****浸没液冷冷却方式
浸没式液冷属于直接接触式液冷的一种技术,其核心原理是将电子设备完全浸入冷却液中,通过冷却液直接吸收产生的热量,并通过液体循环实现热传导。当前,我国已经将浸没式液冷技术投入大规模应用,例如阿里巴巴在其2 MW电力容量、可容纳数千台服务器的冬奥云数据中心中,成功部署了单相浸没液冷服务器集群,标志着液冷技术正式进入商用阶段[3]。同时,在余杭地区,我国首个获得绿色等级5A级认证的全浸没式云计算数据中心也已建成,进一步推动了液冷技术在绿色数据中心领域的广泛应用。
1.1 单相浸没液冷
根据所使用的冷却液在冷却电子器件过程中是否会发生状态变化,可将其分为单相浸没液冷和相变浸没液冷两类。单相浸没液冷通过在整个系统中循环冷却液来消除设备产生的热量。首先,热量从电子设备传递至冷却液中,然后通过循环泵将含有热量的冷却液输送到热交换器,在此过程中与温水进行循环换热作用以持续为设备降温[5]。在单相液冷系统中,冷却液的挥发控制相对较为简便,当系统密封性良好时,冷却液的损失量较小,因此无需频繁补充冷却液。
图1

图1单相浸没液冷系统原理图
1.2 相变浸没液冷
采用相变浸没液冷技术,将电子设备浸泡在具有易挥发性的冷却液容器中。该冷却液具有较低的沸点,在环境温度达到一定水平时,能够通过潜热吸收热量并发生沸腾相变,从而有效降低设备温度。冷却液中的蒸汽随后被冷凝管捕获并冷凝为液态,经循环系统返回液冷槽内进行换热循环。
相变浸没液冷显著提升了服务器的功率密度,并且降低了风扇产生的噪音,同时降低了制冷设备的占用空间,不再依赖传统的风冷基础设施,简化了制冷系统的建设流程。然而,相变过程中的压力变化导致冷却液蒸发损失的控制相对复杂,冷却液容易受到污染,泄漏后难以进行修复。该技术在设计时需根据冷却液的工作特性进行优化调整,相较于单相浸没液冷,其在数据中心的施工难度和成本有所增加[6]。
图2

图2相变浸没液冷系统原理图 2****典型浸没液冷冷却液
无论是单相式还是相变式浸没液冷系统,其关键制冷组件均为将带电状态下的完整服务器或其关键组件浸没在冷却液中。因此,作为换热介质的冷却液必须具备导热能力强但不导电(或具有足够低导电性)的介电特性。这样的介电液体通常不溶于(或难溶于)水及其他离子性介质,最大限度地保障其绝缘性能不易被破坏。同时,该液体本身在气味、毒性、降解难度及可维护性等方面特性应尽可能友好,以减少对环境及操作人员的潜在危害。基于以上技术要求,目前浸没液冷领域应用讨论最为广泛的冷却液主要可分为碳氢及有机硅化合物类和碳氟化合物类。
2.1 碳氢及有机硅类冷却液
碳氢化合物冷却液和有机硅类冷却液在常温下均呈现粘稠状态,因此业内将其统称为“油类冷却液”。在数据中心的液冷应用之前,工业上这类冷却液主要被用作变压器的冷却剂。它们普遍具有沸点高不易挥发、不腐蚀金属、环境友好、毒性低等共性,且成本较低;但由于具有燃点,油类冷却剂在使用中存在可燃助燃风险。常见的油类冷却液可以分为天然矿物油、合成油、有机硅油3大类。
天然矿物油通过蒸馏工艺提取,其生产过程可能涉及深度氢化处理,具有较低的生产成本,且在户外变压器冷却系统中有着悠久的应用历史。然而,在实际应用中,烃类分子的分解氧化难以避免,这会导致冷却液酸性增强以及污染物的产生,进而影响冷却液的特性或导致被冷却设备的腐蚀。合成油则是在合成的烷烃类或酯类化合物基础上加入特定添加剂而制备而成,常见的冷却剂类型包括聚α烯烃(Poly Alpha Olefins, PAO)、天然气合成油(Gas to Liquid Base Oil, GTL)以及合成酯等。合成油的生产工艺更为精细,其杂质含量、抗氧化性能以及材料兼容性相较于天然矿物油均有显著提升,但其闪点问题依然存在。有机硅油的合成工艺依赖于人工制造,可以通过设计优化来提高产品的闪点值,然而其闪点特性与粘度呈正相关关系,这在降低燃点的同时可能导致油品流动性下降,因此在设计过程中需要综合考虑两者之间的平衡关系。此外,硅油还可能因水解或氧化沉积作用而影响接触性能,这些特性需要在产品设计时加以关注。
2.2 碳氟类冷却液
碳氟化合物(Fluorocarbon)是通过将碳氢化合物中的一部分或全部氢替换为氟而形成的有机化合物类别,普遍展现出优异的综合传热性能。这些化合物具有无闪点且不燃的特性。由于C-F键能较大,碳氟化合物具有较强的惰性,不易与其他物质发生反应,因此被广泛用作兼容材料。基于碳氟化合物的组成成分和结构差异,可将其分为氯氟烃(Chlorofluorocarbons, CFC)、氢代氯氟烃(Hydrochlorofluorocarbons, HCFC)、氢氟烃(Hydrofluorocarbons, HFC)、全氟碳化合物(Perfluorocarbons, PFC)以及氢氟醚(Hydrofluoroethers, HFE)五大类。
其中,CFC和HCFC于20世纪初问世,是被广泛应用的制冷剂。然而,由于它们对大气环境特别是臭氧层的破坏性,这两类制冷剂已在《蒙特利尔议定书》中被明确禁止使用。HFC中,最常见的应用领域是家用冰箱和空调系统,其中R410A被广泛采用。值得注意的是,HFC虽然没有臭氧层破坏作用,但会产生温室效应。在半导体设备冷却领域,PFC系列具有显著优势,其应用历史可追溯至大型设备的安装时期。尽管如此,PFC在导致温室效应方面的缺陷同样不容忽视。相比之下,HFE在温室效应方面的影响较小,对臭氧层无破坏作用,但其介电常数较高,这可能导致在与PCB微带线或连接件直接接触时对信号传输产生显著影响。
氟化学公司致力于研发超低温室效应碳氟化合物(Ultra Low GWP),旨在通过在商用需求、生产成本和工艺稳定性方面取得平衡,为环保需求提供更友好且经济的解决方案。相关企业均有所涉猎[7]。
2.3 应用场景差异
对于单相浸没液冷系统,碳氢及有机硅类化合物和碳氟类化合物均可作为冷却液。在升温状态下,为了确保冷却液始终处于液相状态并减少挥发,建议优先选择具有较高沸点的液体介质。此外,尽可能选择较低粘度的冷却液,以确保系统具有良好的循环能力,并减少对泵的压力。相变式浸没液冷系统通常会选择较低沸点且适合相变操作的碳氟类冷却液,以实现吸热汽化和散热液化的循环过程。需要注意的是,大多数碳氢和有机硅化合物具有闪点特性,容易引发火灾或爆炸,因此通常不应用于相变式浸没液冷系统,仅限于单相应用场景。
在实际浸没式液冷系统设计过程中,确定冷却液时需要考虑的因素包括:热物理特性、长期稳定性及清洁度、材料相容性、对信号传输的影响、易燃或可燃特性、安全性、环境影响、维护性,以及一次性投入成本及长期运行成本等。在后续章节中,将对上述重点问题进行深入探讨。
3****冷却液的关键性能
3.1 热物理性能
在液冷系统中,冷却液的热物理特性是影响散热效果的关键因素。在热对流传热过程中,物质密度与比热容的乘积越大,单位体积的传热能力就越强,从而散热效率也随之提升[8]。此外,冷却液的密度、比热容以及导热率等特性与其传热性能之间具有密切关系。粘度是衡量流体在驱动力作用下流动阻力的重要指标,冷却液粘度的高低直接影响其传热效率和流动难度。相对而言,碳氟类冷却液的比热容和导热率相较于碳氢及有机硅类冷却液稍低,但其粘度显著低于后者,因此整体的传热能力不仅没有下降,反而表现得更为出色。
在冷却液的热物理性能指标中,沸点和汽化潜热同样具有重要意义。在单相液冷系统中,为了维持制冷过程中的液体处于液态,需要选择具有较高沸点的冷却液。而在相变液冷系统中,则需要选用在常压下沸点控制在60℃以下且沸程范围较小的冷却液,以满足对电子器件在理想工作温度下的冷却需求。此外,冷却液的沸点不宜过低,因为这会导致冷凝困难,从而影响冷却系统的有效循环。同时,汽化潜热的大小直接影响相变过程的热效率,冷却液的汽化潜热越大,相变过程中的传热效率越高。由于汽化潜热是指在温度不变的情况下将单位质量液体转化为蒸汽所需的热量,因此提高冷却液的汽化潜热能够显著提升其相变热交换性能。
总体来说,高比热容、高汽化潜热以及高液体密度能够有效降低消除定热负荷所需的液体体积流量。高导热率、低粘度和适宜沸点的冷却液能够显著提高传热效率。考虑到影响冷却液散热效果的热物理性能参数种类繁多,在选择冷却液时,建议根据具体场景和整体液冷系统设计进行匹配,并通过具体测试对比分析和筛选。
3.2 材料兼容性和可靠性
由于浸没液体冷却方式中,冷却液与电子元件直接接触,进而制冷过程中冷却液材料兼容性的好坏,直接决定了系统的可实施性、维护成本以及使用寿命。根据浸没液体对不同环节或对象的兼容影响差异,可以将其分为材料兼容性和信号兼容性两大类。
材料兼容性方面,主要涉及冷却液与被冷却设备或组件之间是否存在反应或溶解萃取等影响。碳氟类冷却液具有化学稳定性高,尤其不易与金属、无机物质发生反应,全氟聚醚(Perfluoropolyethers,PFPE)等全氟化合物表现出极高的材料兼容性。相比之下,碳氢类冷却液的兼容性相对较低,尤其是矿物油等天然油;但经过不断优化和改进的合成油在兼容性方面已取得显著进展,如PAO、GTL等。冷却液的兼容性需通过实际测试来评估,通常采用KB(Kauri-Butanol)值作为初步判读指标,KB值越高则冷却液对有机类材料的溶解能力越强。此外,还需特别注意部分风冷下工作的组件在液体环境中的兼容问题,例如,传统机械硬盘HDD无法直接在冷却液下工作,需采用激光封装等技术将HDD密封在氦气环境下的氦气硬盘;而固态硬盘SSD则完全无需担心液体兼容性问题,可以直接应用。
信号兼容性主要关注浸没液体对信号传输完整性的影响。在液冷方式下,设备的高频高速信号需要在接触绝缘冷却液的通信通道中进行传输,而冷却液的介电常数等物性参数会直接影响信号传输效果,导致信号能量衰减。介电常数反映了电介质在施加外部电场时储存能量的能力相对强弱,材料介电常数越小,对信号传输的抑制作用就越弱。特别是在当前数据中心信号传输技术从16 Gbit/s向32 Gbit/s乃至未来的112 Gbit/s发展过程中,冷却系统的设计要求日益提高,需要谨慎选择对信号传输影响较小的冷却介质。目前,实际应用中通常选用工作频率下介电常数较小(≤2)的冷却液。
3.3 总体拥有成本
冷却液的总成本主要由初始投入成本和运营成本两部分构成。初始投入成本指的是液冷系统组建时所消耗的液体费用,而运营成本则涵盖了系统运行中因液体使用后的补充或更换所产生的费用。就初始投入成本而言,矿物油等天然碳氢类冷却液的单价相对较低;人工合成油如酯类、烃类、有机硅类冷却液价格稍高,约为矿物油单价的2倍;碳氟类冷却液的造价较高且密度较大,每升的价格可达合成油单价的5~10倍。值得注意的是,不同配置和种类的液冷系统其液体需求总量会有所差异,业内通常采用L/kW(表示单位电功率所需的液体量)的指标来进行需求估算[9]。
在运营成本方面,主要由液体损失增补液体和寿命结束更换液体的费用两部分构成。在增补液体方面,液体损失主要由蒸发损失和拖带损失组成。油类冷却液通常选用沸点较高的品类,其蒸发量相对较低,因此蒸发损失较小,但因粘度较高,导致更换设备时拖带在设备上的损失更多。相比之下,碳氟类冷却液具有较高的挥发性,蒸发损失相对较高,因此对液冷系统密封要求更为严格,但其粘度较低,更换设备时拖带损失较小。在更换液体方面,主要需关注液体的使用寿命问题。总体而言,碳氟类冷却液的使用寿命高于碳氢和有机硅冷却液。具体而言,矿物油等天然油因杂质含量较高,其保质寿命通常在5年以内。而若维护得当,不考虑其他风险因素,合成油的使用寿命最高可达10年,碳氟类冷却液则可远超20年。
4****冷却液的安全和环境影响
全球范围内,浸没式液冷技术的迅速发展推动了冷却液的开发与应用,但在使用过程中,安全性和环境影响不容忽视。从长远规划的角度来看,数据中心在布署液冷系统时,不仅需要依据散热性能,同时需要从操作安全性和环境影响两个方面进行综合考量,以确保冷却液的选择既高效又环保。
4.1 冷却液的安全影响
在选择冷却液时,首要关注的是操作人员的安全健康问题。冷却液的安全性主要体现在对人体的毒性以及液体的可燃性两个方面。在操作得当、职业接触评估完备的情况下,碳氢及有机硅类、碳氟类冷却液对人体健康危害较小。大多数制造商建议在使用液体时佩戴丁腈手套,以避免接触皮肤和污染液体。在数据中心运营商方面,不同冷却液的安全特性各有不同,在室内使用时需要根据具体情况增加额外的安全措施,例如编写操作手册、制定危险应急制度等。
碳氢及有机硅类冷却液没有很强的刺激性气味,其吸入性危害较小,但普遍具有闪点,且易燃易爆,具有不稳定性。在数据中心建设中,建议专门部署监控系统以进行防范。美国供暖制冷与空调工程师学会(ASHRAE)发布标准34[10],明确碳氟类冷却液作为制冷剂的安全分级,如图3所示,基于特定条件下的可燃性,将其分为A1、A2L、A2、A3四级。其中,毒性A类和B类分别代表低毒性与高毒性。此外,该标准还规定了空气中制冷剂的最大浓度限制(Refrigerant Concentration Limit,RCL),以防止接触人员因窒息或中毒而发生危险。
图3

图3制冷剂安全分级**[10]**
在实际使用过程中,为避免冷却剂对使用者健康造成危害,建议参考化学品安全技术说明书(MSDS)以获取基本理化特性。MSDS中涵盖了化学品的组成信息、理化特性、操作和储存、泄漏应急处理、废弃处理等关键内容,并且根据要求定期更新。在我国,MSDS的编写和内容安排均符合GBT16483标准,为实际操作提供了相应的指导并减少了健康风险。
4.2 冷却液的环境影响
数据中心的低碳绿色理念已获得行业广泛认同,鉴于此,冷却液对环境的影响已成为评估产品性能的重要评价标准。具体而言,通常采用臭氧消耗潜值(Ozone Depletion Potential, ODP)和全球变暖潜值(Global Warming Potential, GWP)等量化指标,同时还要考虑其对土壤和地下水造成的污染,以全面评估冷却液的环境影响。
ODP指标衡量物质对平流层臭氧破坏的效果,GWP指标则用于评估物质对全球气候变暖影响的程度。ODP值和GWP值越低,表明冷却液对环境危害越小。碳氢和有机硅类冷却液具有极低的ODP和GWP值,而碳氟类冷却液则表现出显著的环境影响。在环保意识日益增强的背景下,ODP较高的碳氟冷却液已被淘汰,目前广泛使用的大多数冷却液ODP值均为零。GWP指标的具体表现各不相同,例如全氟氯化物(PFC)具有较强的稳定性,在大气中存在时间较长,其GWP值可达上千,而氟基有机化合物(HFE)的GWP值则相对较低,通常在几百的范围内。因此,碳氟类液体应始终用于密封系统,以最大限度地减少其对大气的释放量。
对土壤和地下水的影响方面,碳氢和有机硅类冷却液具有较低的挥发性,如果发生大量泄漏,可能会导致土壤或地下水污染。尽管大多数合成油被归类为可生物降解类,但泄漏物仍需妥善处理和清理。在报废过程中,无论何种类型的冷却液都应进行处理或回收,并严格遵守当地环境法律法规、管理义务和相关产品安全数据手册(MSDS)中的指导方针进行处理。
欧盟一些国家政府为减少高全球温升(GWP)氟化液的消耗,采取了相应的限制措施,包括实施GWP加权税、对特定应用范围内的氟化液使用进行GWP限制等。欧盟相关法规要求,所有含有氟化液体的设备必须定期进行泄漏检查,以防止其逸出大气,其中GWP值较高的氟化液类物质需要接受更为频繁的泄漏检查。从维护数据中心的角度考虑,为降低后期维护的复杂性,数据中心应优先选择无需或仅需最低限度监管限制(具有环保性、无环境毒害、可生物降解等特性)的冷却液。相关研究指出,采用此类环保型冷却液不仅有助于降低运营成本,还能显著减少对环境的影响[11][12]。
5****发展展望
材料相容性和可靠性是浸没液体应用推广中需要考虑的最基础问题。各子系统和组件共同构成了浸没液冷系统平稳可靠运行的基础,而冷却液作为热传递的主要介质,几乎与系统内的所有材料直接接触。某些冷却液可能促进材料腐蚀或引发生物污染,从而导致冷却系统阻抗或故障;另一些冷却液可能因介电常数不适合而导致系统内信号传输的严重干扰,影响设备的正常运行。因此,必须全面考虑每个系统组件与冷却液的相互作用,在设计和规范阶段,需对材料相互作用和依赖关系进行详细分析,通过严格测试和评估,全面加强化学相容性、潜在的渗透或扩散损失等可靠性和性能风险的综合考量。
在低碳战略指引下,数据中心对冷却液的环境友好特性倍受关注。液冷技术不仅有助于提升数据中心制冷效率、降低能耗,同时也必须警惕其对全球环境的影响。部分冷却液的使用可能破坏大气臭氧层,加剧温室效应,若发生泄漏,将带来严重生态危害[13]。因此,从冷却液的生产、储存、运输、使用到报废处理的全生命周期管理中,必须严格执行相关操作规范和法律法规,确保其对环境的影响可控且友好。绿水青山就是金山银山,数据中心在追求发展的同时,更应肩负起保护地球生态系统的责任,维护人类生存环境的健康。
在液体产品不断更新迭代、数量日益增多的背景下,生态完善与标准化建设已成为行业的必由之路。浸没式液冷技术的推广应用,不仅推动了冷却液产业的蓬勃发展,而且使得市场上涌现出了众多样态多样的冷却液产品。在传统数据中心向液冷数据中心转型的过程中,若缺乏可借鉴的成熟经验与完善的制度保障,盲目推广将导致大量的人力、财力投入以及安全风险的出现。为实现液冷技术的规模化应用,确保冷却液的研发与应用达到成熟可靠水平,需要建立涵盖从技术研发到商业应用的完整生态体系。目前,我国开放数据中心委员会(ODCC)等组织正在积极推进相关标准体系的制定与应用。通过产业界凝聚共识、制定和完善相关标准规范,数据中心液冷技术才能进入大规模商用的加速轨道。
6****结束语
散热能力与效率在数据中心中具有至关重要的作用。随着高密度的发展趋势,以及电力、空间和环境资源的限制,冷却技术得到了显著的发展。不容置疑地,浸没液冷是一种非常有效且相对安全的冷却方式。然而,对于当前整体功率密度相对较低的数据中心而言,浸没液冷的应用存在浪费资源的困境,这使其难以实现大规模推广,成为主要障碍之一。除了显著提升散热能力之外,由于液体的特殊属性,浸没液冷的应用普及仍面临诸多挑战,包括经济成本、材料兼容性、泄漏风险以及机房承重等问题。
总体而言,推广浸没式液冷技术至数据中心并非一蹴而就,需要耐心等待5G等新一代信息技术带来的创新应用机会,助力数据中心功率密度的提升,更能凸显浸没式液冷技术的迫切性。同时,还需培育完善的技术生态体系,以应对产业发展中面临的成本高昂等制约因素,其中冷却介质及相关的标准体系仍需进一步研究和完善。
