AI 时代下的数据中心:氮化镓成为能效关键

,

GaN Systems 策略营销副总 Paul Wiener 撰

数字时代正经历一场由两大趋势驱动的巨大变革,实时数据分析的庞大需求为其一,另一则是生成式人工智能 (Generative AI) 的快速发展。一场激烈的生成式 AI 竞赛正如火如荼的进行中,科技巨头如亚马逊 (Amazon)、谷歌 (Google)、微软 (Microsoft) 皆大举投资生成式 AI 的研发创新。根据彭博智库 (Bloomberg Intelligence) 预测,生成式AI 市场将以 42% 的年增率成长,从 2022 年 400 亿美元市值,于 10 年内扩大至 1.3 兆美元。

在 AI 的蓬勃发展下,数据中心对电力与算力的需求呈正比成长,激增的用电量不仅对运营效率造成压力,更成为数据中心达成净零排放目标的阻碍。当前数据中心所采用的电力转换及分配技术,已难以满足来自云计算及机器学习的运算需求,面对需要能耗更庞大的生成式 AI 应用,数据中心运营商正急迫地寻找创新电力解决方案。

氮化镓 (GaN) 功率半导体应运而生,成为数据中心优化能源效率的关键技术之一。接下来的文章将进一步探讨生成式 AI 对数据中心带来的挑战、氮化镓功率器件的优势,最后分析业界普遍使用的「电源使用效率 (Power Usage Effectiveness, PUE)」指标中所存在的漏洞,这些洞察皆将指向一个结论,氮化镓功率器件在数据中心电力系统中的采用将加速。

生成式 AI 对数据中心的冲击将加剧

面对数据量爆炸,依传统工作负载量所规划的数据中心基础架构正面临巨大压力。全球数据量每两年便翻涨一倍,处理、储存这些庞大数据的服务器,需要大量的能源及水资源来维持运作。根据麦肯锡的预测,在未来五年内,光是位于美国地区的数据中心便将新增 39GW 的用电量,相当于 3,200 万的家庭一年的用电量。

生成式 AI 带来破坏式创新与商机,但随之而来的能源需求也是前所未有。一篇研究文章指出,训练最新一代的生成式 AI 模型所需的算力,较上一代模型高出十至百倍。生成式 AI 应用主要的能耗来自于两方面,一是训练构成生成式 AI 系统核心的大型语言模型 (LLMs) 时需要的能源,另外便是大型语言模型运作时的能耗。

生成式 AI 的用电量高的难以置信,假设每次谷歌搜索需耗费相当于一个 100 瓦灯泡发光 11 秒钟的电量,如今当红的生成式 AI 应用工具 ChatGPT 每回答一个问题的用电量,竟比谷哥搜索高出 50-100 倍。面对突增的电力需求,升级数据中心架构迫在眉睫,某位科技公司领导更指出,接下来 4 年数据中心在升级设备的花费预估将高达 1 兆美元。

虽然如浸没式冷却、人工智能优化方案、废热再利用等新兴技术已经出现,但这些方案皆无法从根本解决问题。由于基于硅设计的功率器件效率低落,现今的数据中心高度依赖冷却系统来维持安全的运作温度,兼具能效、尺寸优势及输出功率的电力解决方案正是当前数据中心急迫所需。

氮化镓:无可匹敌的效率与性能

相较传统电源供应器,基于氮化镓功率器件设计的电源供应器,能实现超群的性能与效率,在生成式 AI 应用不断升级下,成为数据中心理想选择。通过更快的开关速度及卓越的输入和输出质量因子 (Figures of Merit),氮化镓实现电源设计上的优势,带来超越钛金级的能效表现,并大幅提高功率密度。

氮化镓晶体管为电力电子设备带来更高的效率水平,效率提高代表能源损耗减少,设备也能减少过热情形。举例来说,在典型数据中心架构中,基于氮化镓设计的电源供应器每年可为每 10 个机架增加 300 万美元的营收,减少 100 公吨的二氧化碳排放量,省下 13,000 美元的运营支出。当生成式 AI 对电力需求持续攀升、且每机架的功率密度提升至 2-3 倍时,这些氮化镓所带来的优势将更显著。

你也许会好奇,氮化镓的所带来的好处如此显而易见,但为什么数据中心运营商没有立即转用这项技术?广受数据中心使用的电源使用效率指标中有一项经常被忽视的盲点,也就是我们所称「能耗指标漏洞 (PUE Loophole)」,这便是氮化镓技术普及受限的主因。

能耗指标漏洞

PUE 代表 IT 设备负载耗电量占总耗电的比例,普遍作为评估数据中心能源效率的指标。密切监控并持续改善 PUE 对数据中心运营优化十分重要,降低 PUE 代表减少用电量,进而减少运营成本及环境冲击。

然而,PUE 仅计算了电力传输至服务器的效率,却忽略了服务器中电力转换间的能源损耗,这便是能耗指标漏洞,数据中心以 PUE 作为评估整体运营成效时会产生的盲点。这个盲点造成当前许多服务器仍采用效率仅有 90% 甚至更低的 AC-DC 转换器,这代表了每次 AC-DC 能源转换间,有 10% 的能源在转换中被浪费了,这不但增加了电费成本及碳排放量,被浪费的能源同时以热的方式排出,进而提升数据中心对额外冷却系统的需求,冷却系统也是另一个非常耗电的设备。

氮化镓功率半导体将为这个挑战带来转机,为数据中心提供一个立即见效且高性价比的方式来解决能耗指标的漏洞,并省下庞大的电力需求。采用氮化镓功率器件的 AC-DC 转换器,效率可达到 96% ,甚至更高,所减少的功率耗损达 50%,以数据中心平均用电量换算,相当于节省了 370 亿千瓦小时的电量,足以供应 40 座超大规模数据中心一年的电力需求。

生成式 AI 及数据中心的永续发展路径

引述哈佛商业评论 (Harvard Business Review) 的报导,「当人们惊艳 ChatGPT、BERT、LaMDA、GPT-3、DALL-E-2、MidJourney 及 Stable Diffusion 等新兴生成式 AI应用工具的强大能力时,往往忽略了背后隐藏的环境成本。」

无论是开发或是使用这些 AI 应用工具皆极度能源密集,不仅如此,维护这些系统的基础设施同样也需要大量能源。目前这些应用工具仍处发展初期,随着使用者数量愈多,这些能源成本将以惊人的幅度持续增长。根据研调机构 Gartner 的观察,「生成式 AI 的热潮没有任何趋缓的趋势。」

哈佛商业评论及其他专家指出, AI 算法扩大应用领域同时减少环境冲击,AI 技术开发商及用户在扮演关键角色。氮化镓以卓越的效率和性能,为数据中心开拓了一条永续发展的明确路径,只有透过氮化镓技术,方能实现足以支持生成式 AI 及下世代 IT 设备所需的效率及功率密度水平。

通过实现节约能源、减少冷却设备,并提高成本效益,氮化镓正重塑数据中心电力系统的布局。在生成式 AI 及氮化镓技术相互发展下,更高效、永续且强大的数据中心将成为未来主流。