IBM新光学技术:光速训练AI,GPU闲置不再,能效大幅提升

   发布时间:2024-12-11 14:09 作者:沈如风

IBM近期宣布了一项革命性的技术突破,这项新技术能够在极大程度上提升人工智能模型的训练效率,并且显著节约能源消耗。据IBM介绍,这种新型光学技术,若应用于数据中心,将能够节省相当于5000个美国家庭一年能源消耗量的能源。

传统数据中心虽然通过光纤电缆与外部网络连接,但在其内部,仍然大量使用铜线连接GPU加速器。这些GPU加速器在等待其他设备传输数据的过程中,往往会长时间处于闲置状态,这不仅消耗了大量能源,还增加了运营成本。IBM此次推出的技术,正是为了解决这一痛点。

IBM高级副总裁兼研究总监Dario Gil表示,随着生成式AI技术的不断发展,对能源和处理能力的需求也在不断增加,数据中心必须进行相应的进化。而IBM此次推出的共封装光学技术(CPO),正是数据中心进化的关键一步。通过CPO技术,未来的芯片将能够像光纤电缆一样,以光速进行数据传输,从而大幅提升通信速度和能源效率。

在IBM发布的一篇技术论文中,详细介绍了CPO技术的原型。该技术通过显著增加数据中心的带宽,有效减少了GPU的闲置时间,从而加速了AI模型的训练过程。据IBM透露,应用CPO技术后,大型语言模型(LLM)的训练时间可以从原本的三个月缩短至三周,极大地提高了训练效率。

CPO技术还带来了更高的能源效率,降低了能源消耗,并减少了与训练LLM相关的成本。这一突破性的进展,不仅为AI技术的发展提供了强有力的支持,也为数据中心的可持续发展开辟了新的道路。IBM的这一创新,无疑将在AI领域引发一场深刻的变革。

 
 
更多>同类内容
全站最新
热门内容
本栏最新