数据中心浸没液冷中冷却液关键问题研究
摘要
关键词 :数据中心;浸没液冷;冷却液
0 引言
数据中心不仅承担着推动现代经济社会发展的重要职责,并被视为新型基础设施的核心组成部分。它负责收集、存储、处理和分发海量数据信息,在人工智能技术快速发展的背景下展现出更高的需求水平。芯片制程速度逐渐放缓限制了传统架构的发展潜力,在这种情况下计算行业不得不通过提升单个芯片能力的方式来应对日益复杂的计算任务需求——从单个150瓦的CPU功率跃升至300瓦以上;其中图形处理器(GPU)单个单元功率甚至达到了700瓦以上。对于通信设备而言,在运行过程中温度始终是影响其工作性能稳定的关键因素之一;因此在机架密度持续升高的情况下必须采取有效的散热解决方案以维持系统稳定运行[1]。根据冷却原理的不同目前主要的冷却方案可分为基于空气循环的风冷散热与基于液体循环的直接液冷两大类——由于前者架构下机架的最大承载功率仅在20~30千瓦之间而后者则能够将单机承载功率限制在100千瓦以上因此在面对日益繁重的工作负载压力建筑面积受限且对能效要求较高的场景下风冷方案已难以满足实际需求而液冷方案则成为唯一可行的选择
鉴于我国数据中心在PUE指标方面采取了更为严格的管控措施,并日益重视节能减排政策导向下的低碳发展路径,在这一背景下如何实现能效优化成为亟待解决的关键课题。据研究数据显示,在 typical data center operations中, 约三分之一以上的能源消耗集中于IT设备的散热需求, 因此, 在整体节能策略中优化制冷系统能效具有至关重要的作用. 采用基于液体循环换热的技术实现冷却性能提升不仅能够减少能源总消耗量及碳排放量, 并与当前推动国内data center行业向低碳化方向发展的战略目标高度契合.
数据中心的冷却方案主要包括浸没式、分立式等多种类型。其中一种是浸没式冷却方式(简称浸没式),因其高效的散热性能,在降低数据机房功率利用效率(PUE)方面表现出显著优势。近年来成为学界和业界关注的重点研究领域。根据统计数据显示,在未来五年期间内,“浸没式液冷市场”的规模预计将增至7 亿美元,并将以超过20%的年复合增长率增长[2]。随着日益增长的芯片密度需求和技术革新带来的复杂边缘计算场景挑战以及数据中心在节能减排方面的持续压力,“浸没式液冷技术”或将继续推动相关市场的发展壮大。
1 浸没液冷冷却方式
主流的直接接触式冷却技术代表之一是完全淹没式的冷却系统。电子设备被完全淹没在冷却介质中,在这种环境中所产生的热量通过热传导传递给冷却介质,并通过循环回路实现整体散热过程。目前...得到广泛应用并投入实际应用阶段...阿里巴巴在其具备2 MW处理能力的数据中心运营团队实现了单相完全淹没式的大规模部署方案,并成功启动了中国首个工业级热泵型完全淹没式数据机房项目的同时,在杭州余杭建设了全淹没式的云计算仁和数据中心...成为国内首个获得5A级认证的专业化数据机房
1.1 单相浸没液冷
基于冷却介质在冷却过程中物态变化情况的不同, 可将浸没式液冷系统划分为单相浸没液冷和相变浸没液冷两大类. 在单相浸没式液冷系统中, 采用循环回路使冷却介质不断流动以消除设备产生的热量. 其工作原理是: 热量首先从电子设备转移到冷却介质中, 然后通过循环泵将加温后的冷却介质输送到热交换器内, 在此过程中与温水进行连续换热过程, 从而持续为设备提供降温服务[5]. 此类系统中蒸发损失相对较小且易于调控, 当系统的密封性良好时, 蒸发损失会进一步减小且可控.

图1 单相浸没液冷系统原理图
1.2 相变浸没液冷
采用相变浸没式冷却技术将电子设备置于具有易挥发冷却剂的密闭容器中。由于冷却剂沸点较低,在环境温度达到特定条件时会通过潜热吸收热量并发生汽化相变。这种汽化过程可有效降低设备温度,并通过凝结管将产生的蒸汽回流至蒸发器内部形成循环换热系统。
该技术能够实现更高密度的服务器冷却需求,并通过消除风扇产生的噪音并节省制冷设备占用空间而减少了整体占地面积。它不再依赖传统的风冷基础设施系统,并简化了制冷设施的安装和维护过程。然而,在相变过程中存在压力波动问题,并且蒸发损失控制较为复杂。此外,冷却液容易受到污染影响,在这种情况下一旦发生泄漏就难以及时修复。与传统单相浸没式冷却技术相比,在数据中心应用中增加了施工难度和成本[6]。

图2 相变浸没液冷系统原理图
2 典型浸没液冷冷却液
无论是单相型还是相变式设计的浸没式冷却系统,在其运作机制中都需要实现完整的服务器及其关键组件被完全浸泡在特定冷却介质中这一目标。其中关键的制冷机制在于将处于带电状态下的完整服务器或其相关组件完全浸泡在冷却介质中以实现热量的有效转移与管理。因此作为传热媒介的冷却介质必须具备优异的导热性能同时具备良好的绝缘特性(或具有极低的导电性能)。此外此类介电型冷却剂通常不溶解于水或其他离子性溶液中以确保系统的长期稳定运行不受外界干扰影响;与此同时为了保障操作安全与环境友好度这些特殊性质要求也对所选用的具体材料提出了严格的技术指标要求基于以上技术要点目前在浸没式液冷领域内讨论最多的主要分为两类:一类是以碳氢化合物为基础开发出的一系列高效节能型溶液另一类则是基于有机硅化合物设计出的一系列环保性能卓越的产品
2.1 碳氢及有机硅类冷却液
碳氢化合物(Hydrocarbon)冷却液与有机硅类冷却液相仿,在常温下呈现黏稠状态;因此业内将其统一称谓"油类冷却液"。在数据中心采用液体冷却是传统模式前的工业应用中,则主要作为变压器的冷却剂。这些液体普遍具备沸点高不易挥发、不腐蚀金属、环境友好且毒性较低的共性特征,并且具备较为低廉的成本优势;然而由于存在闪点问题,在实际使用中需注意其可燃助燃风险。常见的油类冷却液大致可分为天然矿物油、合成油以及有机硅油三大类型。
天然矿物油来源于石油蒸馏分离,并可能经过深度氢化处理工艺,在室外变压器冷却系统中有较长的应用历史。然而,在实际使用过程中难以避免烃类分子发生分解氧化反应,这将导致冷却液酸度升高并伴随污染物生成,并可能影响冷却液的特性甚至导致被冷却设备出现腐蚀现象。合成油则是基于合成的烷烃类或酯类化合物添加多种添加剂后形成的混合物,在实际应用中主要有聚α烯烃(Poly Alpha Olefins, PAO)、天然气合成油(Gas to Liquid Base Oil, GTL)以及各种合成酯等几大类型。相较于天然矿物油而言,合成油生产工艺更为复杂精细,在抗氧性能、材料兼容性和减震性能等方面均有明显优势;但其易燃性问题依然存在且难以彻底解决。有机硅油则主要通过人工合成技术生产,在设计时能够生产出具有较高闪点的产品;然而其闪点特性仍与其粘度呈现正相关关系,并且在储存或使用过程中可能因水解或氧化沉积现象影响其接触性能表现。此外,在实际应用中还应特别注意硅油产品的流动性和可燃性等问题,在产品设计阶段需综合考虑这两者之间的平衡关系
2.2 碳氟类冷却液
将一部分或全部的氢原子替换成氟元素的有机物称为碳氟化合物(Fluorocarbon)。这种物质属于碳氢化合物的一种变体,并表现出优异的综合传热特性。能够实现无发烟、无爆炸性以及完全不燃烧的独特性能。由于C-F键结合能较强,在与其他物质接触时不易发生反应而具备较高的化学稳定性,在许多领域中被广泛应用于制造复合材料等良好兼容材料。根据组成成分及分子结构的不同变化情况, 碳氟化合物主要可分为以下几类: 氯 fluorocarbons (CFC), 氢取代氯 fluorocarbons (HCFC), 氢 fluorides (HFC), 全 fluorides (PFC) 以及 fluoro ethers (HFE) 等类型.
其中,在20世纪之前就已经广泛应用作为制冷剂的C类氟化物(CFC)与氢氟化合物(HCFC),然而由于它们对大气环境尤其是臭氧层造成的破坏性影响而备受限制,《蒙特利尔议定书》已经将这类物质确定为禁止使用的制冷剂之一。氢氟化合物最常见的应用是在家用冰箱与空调系统中使用R410A作为其独特的制冷剂形式;这种物质具有无臭氧层破坏作用但会导致温室效应的问题;它主要应用于大型设备当中并持续至今仍然存在较高的温室效应缺陷;全氟聚醚(PFPE)类物质则以其独特的沸点及介电特性使其非常适合用于半导体设备冷却场景中;这些材料的应用历史可追溯至五十年代初期的大型设备时代;与H类氟化物类似PFPE系列物质同样面临着较高的温室效应缺陷;
而热电偶相关物质则因其较低的介电常数与较大的热电势而具有特殊的适用范围;
针对日益严格的环境保护要求, 氟化学公司致力于研究开发超低温室效应碳氟化合物(Ultra Low GWP), 以在环保性与商业可行性之间取得平衡, 并满足生产成本合理以及工艺稳定的条件. 这些企业在研发过程中也表现出了兴趣.
2.3 应用场景差异
在单相浸没液冷系统中,碳氢化合物、有机硅化合物以及碳氟化合物均可被选作冷却介质。为了保证冷却介质在升温过程中维持液态状态并减少蒸发现象,应优先选择具有较高沸点值的液体作为冷却介质。在实际应用中,则应尽量选用粘度较低的冷却介质以提高流动性,从而增强流体的动力学性能并降低泵的压力消耗,有助于形成一个高效的内部循环系统。相比之下,在相变浸没式液冷系统中,则通常会选择沸点较低且沸程合适的碳氟化合物作为主要冷却介质,其主要优势在于能够方便地实现吸热汽化与散热液化的循环过程。由于大多数碳氢化合物及有机硅化合物都具有可燃性或易燃性(即存在闪点),因此它们通常不适合用于相变浸没式系统的 coolant choice,仅限于单一相态的应用场景或设备设计中
实际浸没液冷系统设计确定冷却液时的考虑因素包括:
热性能特性的选择,
长期可靠性和清洁度,
材料相容性的评估,
对信号传输的影响分析,
易燃或可燃特性的考量,
安全特性的确保,
环境特性的评估,
维护特性的考量,
以及初始投资与长期运营成本等综合考量,
后续章节将深入探讨这些关键问题。
3 冷却液的关键性能
3.1 热物理性能
冷却液的热物理特性和其在数据中心浸没式液冷系统中的散热表现存在密切关联。在物质间通过热对流传递热量的过程中,当物质密度与比热容的乘积增大时,其单位体积携带热量的能力也随之增强,从而导致散热效率显著提升[8]。该组态下液体密度、比热容以及导热率指标均与其整体传热性能高度相关:相比之下,流体流动阻力系数由粘度决定,而相对较低的液体粘度则意味着在进行流动传热时既高效又便捷。值得注意的是,碳氟化合物类冷却液虽然比熱容量和導熱率略低,但相比而言具有更低粘度特征,因此整体上其傳熱效能更加卓越。
除基本性能外,还应关注沸点与汽化潜热等重要热物理参数指标。在单相液冷系统中,则要求所选冷却剂具备较高的沸点特性值,在制冷过程中始终保持液体状态以避免气态物质出现。而在相变型冷却是采用条件下,则通常选择具有常压下沸点低于60℃且具有较小温差范围(即较窄温差)的冷却剂类型,并以此满足对电子设备理想工作状态下的散热需求。此外,在设计时应尽量避免选择具有过低沸点的冷却剂品种(因为这可能导致气态物质在系统内部凝结而影响循环效率)。而较窄温差范围则能显著提高冷却效率:其原因在于较小温差使得设备表面各区域之间的温度梯度减小从而进一步提升传热速率;同时还需要考虑其具有的汽化潜热大小:该参数值越大则表明单位质量物质发生相变所需的热量越多从而能在不改变整体温度状况下实现更高的换热量。
总体而言,在提高散热效果方面具有优势的冷却液特性包括:较高的液体密度、较高的比热容以及较高的汽化潜热。这些特性有助于降低定焓载荷所需的液体体积流量;同时具备较高导热系数、较低粘度以及适宜沸点特性的冷却剂能够增强传热能力与效率。考虑到影响散热效果的多个关键热物理参数较多,在选择冷却液时应当结合具体应用场景与整体液冷系统设计方案;建议通过实际测试对比分析并进行筛选以确保最优匹配性。
3.2 材料兼容性和可靠性
由于浸入式冷却介质在操作过程中直接接触电子元件,在制冷过程中冷却介质材料的相容性直接影响着液冷系统的实际应用范围、运行成本以及使用寿命。基于不同环节或对象对浸入式冷却介质的相容影响差异,则可将其划分为材料相容性和信号相容性两大类。
材料相容性方面主要涉及冷却液与被冷却设备或组件之间是否存在反应溶解或萃取等影响现象。碳氟类冷却液展现出高度的化学惰性尤其不易与金属无机物质发生反应而全氟聚醚(Perfluoropolyethers PFPE)等全氟化合物则展现出极高的材料相容性特征能够有效避免上述问题。相比之下碳氢类冷却液在相容性方面相对较为有限尤其是矿物油等天然油其兼容性虽有提升但仍需依赖特定工艺改进如PAO GTA等新型合成油已取得显著进展。为了量化评估冷却液的相容性能采用KB(Kauri-Butanol)值作为基准参数其中KB值越高表示该冷却液对有机类材料具有更强的溶解能力。此外在某些风冷系统中需特别注意设备内部液体环境的安全性例如传统机械硬盘HDD无法直接与冷却液共存需采用激光封装等技术将其密封于氦气环境下的氦气硬盘系统;而对于固态硬盘SSD由于其本生即具备良好的干燥性能通常无需考虑液体环境的影响即可正常运行
信号兼容性主要体现在浸没介质对信号传输质量的潜在影响。采用浸没液冷技术时,在设备内部由接触绝缘性冷却液的通道中完成高频高速信号的通信传输过程。其中,冷却介质的介电参数等物性特征会对信息传递效果造成显著影响,并导致其能量衰减。具体而言,介电常数作为表征电介质特性的重要参数之一,在施加外部电场时反映了物质储存能量的能力。当材料体系呈现较低介电常数特征时,在相同工作频率条件下会对信息传递造成的阻碍作用会相应降低。就当前数据中心 signal 信道带宽逐步提升至 16 Gbit/s、32 Gbit/s 乃至未来 112 Gbit/s 的发展需求而言,在设计散热系统时应充分考虑所选冷却介质对其 signal 质量的影响程度,并采取相应的优化策略以降低其负面影响。在此背景下,在实际应用过程中通常会选择具备较低工作频率下介电常数(≤2)特性的冷却介质作为 primary 热交换载体。
3.3 总体拥有成本
该种冷却介质的整体持有费用主要包括初期投资与日常维护两部分构成。
其中初期投入包括建立液冷系统所需的起始期设备及材料费用。
日常维护费用则主要涉及根据实际使用情况补充或更换冷却介质。
就基质选择而言,
以天然碳氢化合物为基础制成的矿物油等基质价格较为经济;
酯类、烃系以及有机硅材料制成的人工合成油介于两者之间。
值得注意的是,
这类材料通常具有较高的单位重量价值,
并且由于其特殊性能特点,
在特定场景下往往能够提供更为稳定的散热效果。
运营成本方面主要包括两大部分:一是补充液体所造成的液体损失费用;二是设备运行至寿命终点时需要更换冷却液的费用。在补充液体方面,液体损失主要由蒸发损失和拖带损失两部分构成。其中油类冷却液多选用沸点较高的产品,在运行中蒸发量相对较小因而蒸发损失也较为有限;但其粘度较高导致在设备更换时附着于设备表面的拖带损失更多。相比之下碳氟类冷却液由于具有较高的挥发性导致蒸发损失相对较大因而对液冷系统密封要求更高但其粘度较低使得更换设备时的拖带损失较小。在更换液体方面需要注意的是主要影响因素是冷却液的使用寿命具体而言碳氟类冷却液的使用寿命普遍高于碳氢和有机硅类型而矿物油等天然油因其杂质含量较高保质寿命通常控制在5年以内经过维护优化不考虑其他风险因素下合成油最多可维持10年以上使用寿命碳氟类冷却液则通常能够超过20年
4 冷却液的安全和环境影响
全球范围内浸没液冷技术迅速发展并得到了广泛应用,这促使相关领域的研发人员致力于冷却液的技术创新与优化应用,然而在实际运用过程中,设备的安全性和环保性能仍然存在诸多挑战需要应对.从长远的技术发展角度来看,数据中心在规划部署液冷系统时应当综合考量系统的散热性能、设备的操作安全性以及环境适应性等因素,从而科学地选择最适合的技术方案.
4.1 冷却液的安全影响
在选择冷却液时首先要考虑操作人员的安全健康问题。冷却液的安全特性主要涉及对人体毒性以及液体可燃性两个关键因素。在正常且得当的操作条件下职业接触评估完备的碳氢硅类和碳氟类冷却液均对人体的影响较小。大多数情况下建议在使用液体时佩戴丁腈手套以避免皮肤接触或污染接触到物体从数据中心运营者的角度来看不同冷却剂的安全特性有所差异因此室内环境下可能需要采取相应的安全措施例如编写操作手册并建立应急安全制度等
这些冷却液无明显的刺激性气味,在人体健康方面吸入危害较小;尽管多数具有易燃特性,并且稳定性较差,在数据中心建设中仍需特别注意配置监控系统以防止风险。美国供暖制冷与空调工程师学会(ASHRAE)发布标准34[10]规定碳氟类冷却液作为制冷剂的安全分级:该组织制定了关于这类制冷剂安全等级的标准;根据不同条件下的可燃性水平分为四个安全类别:一级至四级;其中毒性A类和B类分别表示低毒性和高毒性;同时规定了空气中可燃性物质的最大允许浓度(Refrigerant Concentration Limit, RCL),以确保人员接触时不会发生窒息或中毒风险。

图3 制冷剂安全分级[10]
在实际使用过程中, 为了防止冷却剂对使用者健康的潜在危害, 可以从化学品安全技术说明书(Material Safety Data Sheet, MSDS)中查阅其基本理化特性. MSDS详细列出了化学品的组成信息、理化特性以及操作处置与储存指南等关键内容, 并定期根据要求进行更新. 在我国, MSDS的编写遵循GBT16483标准, 为生产操作提供了相应的规范依据并明确了 health hazards.
4.2 冷却液的环境影响
绿色低碳发展的理念在数据中心行业已获得广泛认同,在选择冷却液时需重点关注其对环境的影响程度。具体而言,通常会参考臭氧消耗潜值(O ozone Depletion Potential, ODP)、全球变暖潜值(Global Warming Potential, GWP)以及对土壤及地下水污染等多方面指标来进行综合评估。
OPD作为衡量物质破坏平流层臭氧作用的标准,而GWP则用于评估物质对全球气候变暖潜在影响的程度.当ODP值与GWP值较小时,表明该冷却剂对环境危害较小.其中,基于碳氢与有机硅类材料制成的冷却剂具有较低的ODP及GWP指标,而采用碳氟化合物制作而成的冷却剂则面临着更为严峻的环境影响问题.随着全球环保意识日益增强,已有较高ODP值的碳氟型冷却剂逐渐被淘汰,目前市场上的大多数产品其ODP指标已达到零水平.在GWP评估体系下,各物质的具体表现差异较大,例如在大气环境中存在寿命方面表现较为突出的是全氟化合物(PFC),其平均存在寿命可达数十年之久;而常见的聚有机化合物(HFE)等则呈现出较低的GWP数值,一般维持在数百范围内.从环境保护的角度出发,建议优先选用含氟型液体作为密封介质,以最大限度地减少其逸出大气的可能性.
针对土壤及地下水污染的影响而言,在碳氢与有机硅类冷却剂应用中存在较高的挥发性特征;若发生大规模泄漏将会导致土壤或地下水体遭受污染损害。尽管多数合成油品常被视为可生物降解物质,在泄露情况下仍需立即采取控制措施并妥善清除泄漏物以防止进一步扩散。不论哪种类型的冷却剂,在报废程序中均需按照相关法规及技术规范进行妥善处理或回收
某些国家政府为了减少高全球温室气体排放(GWP)氟化液的使用量,在实施了一系列相应的政策与措施[11]。根据欧盟相关法规要求,在使用含氟液体的设备必须定期进行泄漏检查工作;其中具有较高全球温室气体排放值(GWP高的)液体,则需更为频繁地接受泄漏检测程序;由此可知,在降低后续维护难度方面,在数据中心内部应当优先选择那些无需或仅需最低限度监管控制(具备环保性、无环境危害性、可生物降解等特性)的工作冷却液[12]。
5 发展展望
材料相容性和系统的可靠性是推广浸没液体应用时必须考虑的基础问题。各个子系统和组件构成了确保浸没液冷系统稳定运行的关键基础。冷却液主要负责热传递功能,并几乎与系统中的所有材料直接接触。某些特定类型的冷却液可能引发材料腐蚀或生物污染现象;而另一些不合适的冷却剂则可能因电介质常数不合适而导致严重的信号传输干扰问题。因此,在设计阶段需要详细分析各个组件与冷却剂之间的相互作用关系,并制定相应的规范以确保系统的可靠性和性能安全。通过详细测试加强评估化学相容性、潜在的渗透或扩散损失等可靠性和性能风险因素
在数据中心低碳战略指导下,冷却液的环境友好性不容忽视。液冷技术不仅有助于数据中心提升制冷效能并减少能源消耗,在应用过程中也需警惕潜在环境问题。部分冷却液使用可能破坏大气臭氧层并加剧温室效应,在使用过程中若发生泄漏可能导致严重的生态问题[13]。因此,在冷却液的全生命周期管理中应当严格遵循相关操作规范和法律法规以实现对环境影响的有效管控绿水青山就是金山银山——在数据中心发展的同时不忘保护地球生态系统和人类生存环境
面对日益增多且更新换代不断加快的液体产品, 生态完善与标准化是行业的必经之路。随着浸没式液冷技术的应用范围不断扩大, 冷却液产业正处于蓬勃发展之中, 各类创新性的冷却液产品层出不穷, 满足了不同场景下的多样化需求。在传统数据中心向液冷数据中心转型的过程中, 若缺乏可借鉴的经验和技术标准, 盲目推进可能导致大量的人力物力浪费以及安全风险。因此, 为了实现液冷技术的有效大规模部署, 需要构建完整的从技术研发到商业化应用的技术体系, 如中国开放数据中心委员会等专业组织正积极推动相关标准制定与实践探索以促进这一目标的实现
6 结束语
散热性能和效率对于数据中心至关重要,在高密度环境下电力、空间和环境资源的限制推动了冷却技术的进步。尽管浸没式液冷是一种高效且相对安全的技术,在现有条件下其应用仍显多余——这正是制约其大规模推广的主要原因。此外,在提供超群散热能力的同时浸没液冷还面临诸多挑战包括高昂的成本材料兼容性以及潜在的泄漏风险等问题这些因素共同影响了其在数据中心中的普及程度
总体而言,在推广浸没式液冷技术至数据中心时不能一蹴而就
