在算力服務器這行干久了就知道,電源變壓器真不是參數表上那幾行數字能說清的講明白的。多少還有有些門道的,全是在工地上、機房里摸爬滾打,一點點攢下的實底兒。
就說去年吧,我們接了個 AI 數據中心的活兒。那兒的機架邪乎,單個就得扛 120kW 的負載,里面塞了八臺訓練服務器。電網拉過來的 380V 交流電,服務器主板上的 CPU、內存根本用不了 ,它們只認 12V、5V 的低壓電。這時候變壓器就得先把高壓往下壓,再通過整流模塊轉成直流。
剛開始我們上的是普通工頻變壓器,結果機架里的溫度總比設計值高 5 度,手往機架門上一摸,能明顯感覺到熱氣往外冒。后來換成高頻隔離變壓器,嘿,轉換效率從 89% 漲到 94% 不說,摸變壓器外殼,就只有點溫乎氣兒。這事兒讓我琢磨明白,高密度算力的地方,變壓器自己耗多少電、散多少熱,真能牽著整個機房的散熱節奏走。
這些年,我們在這方面踩過不少坑。前兩年,有一個金融算力集群,服務器總是在半夜宕機。我們查了三天,才發現是變壓器的動態響應跟不上。那些高頻交易服務器,算力峰值能一下子沖到額定功率的 1.5 倍。而老款變壓器的磁芯飽和速度太慢,電壓一下降,就會觸發保護機制。后來,我們換成了帶納米晶合金鐵芯的變壓器。這種變壓器的響應速度快了十倍,之后就再也沒出過錯。這說明,在算力場景中,變壓器不光要考慮功率,瞬態性能也很關鍵。
選擇變壓器時,不能只看參數表。大家常說,240V 直流配電方案不錯,效率比交流方案高 3 個點。但這種方案有個前提,就是服務器集群的規模要達到上千臺。上次,我們給一個中小型邊緣計算中心做推薦。對方核算成本后發現,定制 DC-DC 變壓器的費用太高,承擔不起。后面,他們還是用了常規的 AC-DC 方案。所以,選擇變壓器要選合適的。這得看機房的規模、負載特性,甚至還要考慮未來三年的擴容計劃。
安裝調試的時候,老工程師的一些經驗之談很有用。接線端子一定要用扭矩扳手擰到規定的數值。上次有個機房,就因為多擰了半圈,導致接觸電阻變大。半年后,變壓器的端子就燒黑了。接地線纜的截面積也不能省,尤其是在雷雨多的地區。去年,南方有個數據中心,因為接地沒做好,雷擊的時候,變壓器的浪涌保護器直接炸了,還連帶燒壞了三臺服務器。這些細節看起來小,但出了問題就會造成麻煩。
現在做液冷服務器方案,對變壓器的要求又有了變化。在浸沒式液冷的機箱里,油溫能達到 35 度,普通的絕緣材料根本承受不住。我們嘗試把變壓器的鐵芯換成耐高溫的硅鋼片,線圈用聚酰亞胺漆包線。這樣一來,成本上漲了 15%,但變壓器在滿負載運行時,溫度能穩定控制在 60 度以內。這也是從實踐中摸索出來的經驗,技術參數要跟著應用場景變化。