科学家在租用NvidiaA100GPU进行人工智能训练时可以获得巨额折扣但这种折扣不会持续太久

综合 2024-02-08 10:05:51
导读 国家能源研究科学计算中心(NERSC)的用户本月可以半价在该组织的Perlmutter超级计算机上运行人工智能作业。由于全球范围内缺乏用于人工智能...
2024-02-08 10:05:51

国家能源研究科学计算中心(NERSC)的用户本月可以半价在该组织的Perlmutter超级计算机上运行人工智能作业。

由于全球范围内缺乏用于人工智能工作负载的计算能力,该设施(代表美国能源部科学办公室运营)正在改变这一现状。

9月7日至10月1日期间,向该组织注册的人员将收取正常费用的一半。例如,通常在七个节点上运行的三小时作业将收取21个GPU节点小时的费用,但整个9月份,将收取10.5个GPU节点小时的费用。

“现在利用您的时间有利于整个NERSC社区,并在全年中更均匀地分配需求,因此为了鼓励现在使用,我们将从明天开始一直到9月底,将在PerlmutterGPU节点上运行的所有作业打折50%,”写道用户参与小组负责人RebeccaHartman-Baker。

Hartman-Baker还指出NERSC将为用户提供额外的帮助。这可能对那些性能不佳并需要帮助确保其脚本符合要求的人有用,或者只是那些想要尝试代码但不确定从哪里开始的人以及其他潜在用途的人。

Perlmutter成立于2021年,是一款HPECrayEX超级计算机,采用AMDZen3EpycCPU和NvidiaA100TeslaCoreGPU。在开发的第一阶段,该机器配备了1,536个GPU加速的AMDCPU节点,每个节点包括四个A100GPU,并辅以35PB全闪存Lustre存储。第二阶段超级计算机增加了3,072个纯CPU节点,每个节点配备两个AMDEpyc处理器和512GB内存。

超级计算机本身主要用于核聚变模拟、气候预测以及材料和生物研究。Perlmutter上运行的第一个工作负载包括一个探索原子相互作用如何工作的项目,这可能会带来更好的电池和生物燃料。

运行人工智能工作负载的GPU能力很难获得,遗憾的是,该优惠仅适用于NERSC成员。它最初是由微软高性能计算(HPC)专家GlennLockwood指出的,他指出NERSC可以通过用商业工作负载回填闲置容量来“大赚一笔”。

这尤其适用于学者们大部分不在的夏季。然而,还有其他租用GPU的方法,包括通过Akash的去中心化AI网络超级云。

免责声明:本文由用户上传,如有侵权请联系删除!