我们都知道,谷歌变了,2018年开始向液冷转型,原因是AI。自从谷歌的AI芯片TPU问世之后,它的并行计算能力强大,也十分耗电,以至于到了TPU3.0,传统的空气冷却完全不行了。所以,自从TPU3.0在内部推出以来,谷歌数据中心的工程师就急忙改造基础设施以适应芯片级液冷,即使这样会增加成本。
AI所带来的先进生产力和竞争力,让风冷转液冷的麻烦和投入,变得非常值得。
其次,技术的粘性在变强。
每一种新兴技术的规模应用,都需要经过长期的实验和迭代,来保证技术的实用性、稳定性。
近年来我们看到,液冷的技术也有了非常大的飞跃,使其能够走向产业化应用。
技术变化一,芯片级冷却的突破。
芯片级冷却,可以直接对发热量较大的CPU、GPU,进行针对性地冷却,这样制冷更精确,冷却效果当然也就更出色,可以支持更强大的芯片。而做到芯片冷却,是非常考验设计能力和制造工艺的。目前这方面已经有非常多的产品问世,比如阿里云“麒麟”是国内第一个尝试芯片级液态制冷的产品,将带有芯片的集成电路板直接浸入液体,有效提升散热效果。
技术变化二,冷板式液冷的可靠性加强。
应用最为广泛的冷板式液冷技术,也有非常大的提升。对于冷板式来说,用户最担心的就是漏液风险。冷却液仍存在极小的安全性泄漏隐患,一旦发生可能引发严重的生产停运事故。
我们看到,头部厂商已经通过提升管路焊接工艺、增加智能漏液监测装置、使用相变等新技术、液环式真空CDU系统等,来多角度、全方位防范漏液风险,提升冷板式液冷的可靠性、安全性。
技术变化三,浸没式液冷的下沉。
液冷有三种主流方式:冷板式、浸没式、喷淋式。其中,冷板式最大众,是应用最早的液冷技术,曙光、浪潮、百度、华为等都开始在数据中心应用冷板式液冷技术;喷淋式最没存在感,公开的应用很少;浸没式,长期以来是创新性极强的“黑科技”,节能性强,也是最为昂贵的“高岭之花”。近年来,浸没式液冷也开始从超算飞入寻常数据中心,有了“技术下沉”的趋势。
比如2021年,微软研发了一种非常先进的两相浸入式液冷方案,将电子元件浸入一桶液体中,这种液体的沸点很低,50°C(122°F)就会沸腾蒸发,吸走设备运行时产生的热量,这一技术已经在位于华盛顿州昆西的数据中心运行,也让微软成为第一家在生产环境中运行两相浸入式液冷的云厂商。
国內,中科曙光此前也已经在超算系统中应用了浸没式液体相变的冷却方式,积累了相应的技术和实践,并开始将其带到数据中心,阿里也推出了单相变液冷产品。
另一个粘性,体现在成本的显著下降。
前期的建设成本。目前国内外厂商都开始推出模块化设计的冷板式液冷解决方案,各个模块(外冷设备、CDU模块、集群环网模块等)独立设计、独立安装,大大提升了数据中心的建设效率,可以快速部署,省掉很多工时和流程,从而间接降低用户成本。
后期的维护成本。近年来有实力的头部厂商开始推出“交钥匙工程”,提供液冷数据中心全生命周期整体解决方案,全线布局、加强服务,来降低绿色数据中心的后续成本。
折中的部署成本。一些传统的风冷数据中心,不能新建机房,改造成本又比较高,难道就只能望洋兴叹了吗?液冷产业还真想出办法了,有厂商的液冷产品支持风液混布,风冷和液冷分别处于不同的子机房,互相之间独立无干扰,一样可以达到降PUE的效果,同时无需改造风冷机房,避免了楼梯改造、空间重布的麻烦。
需求强劲、技术可用、成本下降,液冷近年来的创新确实是踩在了时代的韵脚,黏住了数据中心,也黏住了基础设施厂商。曙光、华为、联想、阿里云、浪潮、宁畅等知名厂商纷纷发力,热度看来还能再持续一阵。
能也:命运掌握在谁手里?
有句老话,时也命也运也,非吾所能也。成功有时候靠的是天命和运势等,超出了个人的掌控能力。表现在科技领域,就是那些站在新技术浪潮之巅的企业,往往能随着时代巨浪向前发展。
这是不是说,只要抓住“液冷”这个概念,就能吃到数据中心行业接下来的红利呢?
归根结底,要站上时代之巅确实有运势一说,不全看真本事,但不能没有真本事。
2022年以来,厂商都在将液冷列入战略规划,加大投入力度,我们能隔三岔五听到液冷的产品与解决方案发布,隐隐有着全行业开花的趋势。
然而必须承认的是,大众对液冷的关注,很大一部分来自双碳政策的压力,追求数据中心节能的“政策正确”,企业必须在压力下去更新IT基础设施是“液冷”逻辑成立的前提。
而商业逻辑之外,我们更应该看到,液冷技术大规模商用的瓶颈,才能更好判断,哪些企业是真的能交付成熟的产品,哪些企业是将“液冷”作为一种趋势在对客户宣讲。
第一个门槛,就是长时间投入的定力。
液冷数据中心是典型的技术密集型产业,需要参与者有多年的研发经验,来积累和掌握前沿技术,较高的研发费用决定了这只可能是少数头部厂商的游戏,还是要跟进微软、谷歌、华为、阿里、浪潮、曙光、联想等头部厂商的动态。尤其液冷数据中心的落地部署都是近年来才完成,缺乏长周期、大规模的验证,比如浸没式液冷还有很多技术规范是空缺状态,这些企业的发展布局较早,使用过程中的可靠性更有保障。
第二个门槛,是标准化和定制化的平衡。
没有标准化、规范化的产品设计和制造能力,产品和解决方案的成本很难被摊薄,后续的扩展和适配也可能存在隐患。与此同时,数据中心的规模不同、承载的业务负载也不同,比如用来进行AI大模型训练的企业级数据中心,和小型数据中心,对液冷服务器产品的需求截然不同,电力系统、能源条件、能效目标等指标也各不相同,这又要求企业能够针对性地定制产品和解决方案,满足多元化的需求,非标产品也能做到成本可控,这非常考验厂商的精益生产。
第三个瓶颈,是软实力的充分完善。
数据中心采用液冷技术和产品涉及到复杂的规划、改造、运维等工作,基础设施厂商不仅要能提供过硬的硬件产品,软实力也必须过关。一方面,是足够全面,通过全生命周期从规划到运维的服务,为客户解决全系统环节可能出现的问题,充分保障液冷数据中心的可靠运行。另一个是足够高效,通过人工智能等技术提高服务器利用效率,能耗治理不是“引入液冷,万事大吉”,还要通过电力网、算力网和热力网的协同优化,构建最优能耗体系。谷歌使用DeepMindAI产品在40个月内将冷却能耗减少了18%。此外,足够多的朋友。液冷是非常需要产业链协作的,从上游的冷却液、芯片供应商到部件生产商、下游的ISV经销伙伴,拥有一个友好开放的朋友圈,确保供应链的韧性和最终交付效果也是“软实力”的体现。
从长远来看,面向算力时代,液冷本身的前景远大是真实的,不过短时间内,产业条件和应用性还有待加强,必定是先经过一个个示范案例落地的逐步验证和经验积累,最终一步步过渡到全液冷、全绿色的产业革命。
液冷来到临界点,后面必然是巨大变化的开始。数据中心和一个凉爽的夏天,距离已经不远了。
中嘉和信作为深耕IDC行业十余年的数据中心服务商,致力于成为行业领先的数字化业务连续性保障服务提供商。业务覆盖金融机构、银行保险、人工智能、电商零售、交通运输、生产制造、能源化工、地产建安、生活服务等多个行业。中嘉和信为客户提供数据中心规划建设、数据中心托管运营、公有云、私有云、混合云、DCI全球组网、云网融合、信创集成服务、安全集成服务等定制化解决方案,依托经验丰富的专业技术服务团队和先进的运维服务管理体系,持续为各行业客户提供一站式数字化业务连续性保障服务,陪伴客户共同成长,助力客户实现梦想。如有业务需求请拨打010-51265666进行咨询,欢迎预约参观机房!
文章来源:互联网,如有侵权联系删除!