Starcloud 在太空中成功训练大型语言模型

AI行业资讯2小时前发布本文共计1019个字,预计阅读时长4分钟。 墨白
3.2K 0 0

NVIDIA 支持的初创企业 Starcloud 近日宣布,已在太空中成功完成大型语言模型的首次训练实验,这被视为朝向构建太空数据中心的重要里程碑。随着全球对算力与能源需求的持续增长,利用太空资源已成为技术演进的一个新兴方向。

Starcloud 于上月发射的 Starcloud-1 卫星搭载了 NVIDIA H100 GPU,成功对 Andrej Karpathy 开发的 nano-GPT 模型进行了训练,并在谷歌 DeepMind 推出的 Gemma 模型上进行了推理任务。公司创始人兼首席执行官 Philip Johnston 在 LinkedIn 上发文表示:“我们刚刚在太空中借助 NVIDIA H100 完成了首个 LLM 训练!我们也是全球首个在太空环境中运行谷歌 Gemma 版本的团队。”

Johnston 进一步指出,这一成果标志着将计算资源向太空迁移的重要进展,旨在缓解地球能源资源的消耗,同时充分利用近乎无限的太阳能。公司首席技术官 Adi Oltean 也强调,在太空中运行 H100 需要工程团队进行一系列创新设计,团队已规划在未来测试更多模型。

Starcloud 成立于2024年,其核心理念是构建太空计算中心,以应对传统数据中心所面临的环境压力。根据国际能源署预测,到2030年数据中心的耗电量将翻倍。此外,地面设施还面临水资源短缺与碳排放上升等挑战,而太空平台可依赖持续的太阳能供应,并避免散热带来的能源损耗。

该公司计划打造一个完全依靠太阳能驱动的太空数据中心,设计规模达到 5 吉瓦,覆盖面积约四公里。预计这一设施将超越美国目前最大的发电厂规模,同时相比同等规模的地面太阳能发电站具备更低的成本与更紧凑的结构。

除了 Starcloud,谷歌、SpaceX 以及贝索斯旗下的蓝色起源等公司也在探索太空数据中心的可行性。谷歌近期公布了 Suncatcher 项目,旨在将 AI 数据中心部署至地球轨道,通过卫星间的高通量光学链路构建分布式计算集群。谷歌首席执行官 Sundar Pichai 将其称为“月球计划”,并计划于2027年启动初步测试。

与此同时,SpaceX 也计划利用下一代 Starlink 卫星构建太空数据中心,并预计在未来五年内使其成为成本最低的 AI 计算选择之一。

要点概述

  • Starcloud 成功在太空中完成首个大型语言模型训练,向太空数据中心建设迈出关键一步
  • 公司计划建设 5 吉瓦的太阳能太空数据中心,规模预计超越现有最大地面电厂
  • 谷歌、SpaceX 等多家企业正积极推进太空数据中心相关技术布局
© 版权声明

相关文章