前几天听了淼算科技-液冷专家赵总线上的“液冷技术讲解”,对于主流液冷方案有了更全面的了解,今天和大家简单做个分享,比如同样是一台4090八卡服务器用风冷、冷板及浸没对于耗电量的不同,液冷两种主流方案“冷板”和“浸没式”相比各自的优缺点,冷板&浸没方案中冷却液有哪几种优缺点如何?等等下面是目前市场主流的4090八卡机的配置,可以看到设备包括了2颗至强第五代CPU、512G DDR5的内存、1块系统盘、一块加速盘、4块2700W冗余电源以及8张4090的GPU卡;我们按照粗略估算,单台设备风冷的情况下整机最高功耗约为4.6kw;冷板的散热方案下最高功耗约为4.2kw,浸没式方案的最高功耗约为4.0kw;我们按照1000台的规模,满负荷运行5年,电费按照7毛一度电算,5年累计可节省约1800万的电费,计算方式如下:1、风冷版的4090八卡机五年电费计算方式如下:
1年耗电量:4.6 kW × 24 小时/天 × 365 天/年 = 40,176 kWh
五年总耗电量:40,176 kWh/年 × 5 年 = 200,880 kWh
4.6 kW设备满负荷运行五年,总耗电量为200,880度电。
1年耗电量:4.2 kW × 24小时/天 × 365天/年 = 36,792kWh
五年总耗电量:36,792kWh/年 × 5年 = 183,960kWh
4.2kw设备满负荷运行五年,总耗电量约为183,960度电。
1年耗电量:4 kW × 24 小时/天 × 365 天/年 = 35,040 kWh
五年总耗电量:35,040 kWh/年 × 5 年 = 175,200 kWh
4kw设备满负荷运行五年,总耗电量约为175,200度电。
简单分析一下主流GPU服务器的散热方式,风冷方案可类别为天热吹电扇,冷板方案则可类比为通过退热贴的方式带走热量,而浸没式类比为直接用浴缸泡澡,虽然都能解决散热但是效率有所不同;液冷方案中冷板和浸没目前市场比较成熟且应用比较广泛,两种方案各自的优缺点如何呢?分析如下 | | |
| | |
| | 改造比冷板大,主要是考虑前IO的设计以及去掉所有风扇、空前盘等,100%全液冷散热 |
| | |
| | |
| | |
| | |
| 冷却液流量小,要求进液的温度低,无法全年依赖自然冷源 | |
主流的有去离子水、乙二醇、丙二醇和氟化液(支持相变),分析如下:浸没液冷所用冷却液主要分为碳氢油类和氟化液,其中碳氢油类优点为密度小、难挥发、无环保压力、价格实惠,缺点为不挥发,因此特殊情况(如资产变卖)下需要进行清洗(运维时不需要进行清洗)。
氟化液优点为无需清洗,阿里、字节等大厂验证项目多。
主要指标有燃点、闪点、倾点、运动粘度、比热容、导电率、介电常数、电阻率等等,下图是以水为参照,把主流的油类和氟化液方案做了对比;可以看到全球液冷市场依然是北美地区占比大,起步早,主要玩家有openAI、Meta、微软、亚马逊这类AI公司、IT公司占主导,采用冷板方案为主,国内市场占全球份额约10%,主要玩家是头部互联网大厂和运营商,26年国内预计液冷将会迎来爆发,在全球的占比会提升。最近(2.6-2.8共三天)老张受邀作为讲师之一去参与一个“液冷智算中心”主题的培训,其中的两个章节(对应下图中的前两章)是我讲,后面章节是淼算科技的赵总讲解(他在液冷领域非常资深,有多年的实战经验),对课程感兴趣的可以加我vx17603229978咨询;另外,4月份老张受邀作为嘉宾之一,参加一个液冷峰会活动的主题演讲,活动很有影响力,做液冷相关领域的朋友可以了解一下!