ChatGPT惨败Llama!MIT官宣AI开飞船0%失败率,马斯克火星殖民不再是梦
【导读】MIT最新研究让LLM直接操控宇宙飞船进行太空追逐挑战赛:ChatGPT少量微调即获第二,开源Llama更胜一筹,凭提示词精准追踪卫星、节省燃料,更是0%失败率,验证AI小数据高效与自主航天可行,为未来的太空漫游铺路。
刚刚,一项最新关于AI「驾驶」宇宙飞船的研究刚发布就火了!
在由Kerbal Space Program衍生的航天挑战赛中,MIT等研究团队让ChatGPT作为「主控」智能体,竟然一举夺得第二名。
这项比赛被视为太空探索自主化的重要实验场,而AI的表现,也预示着「AI开飞船」或许比我们想象的更近!
或许,太空漫游2027真的可以成为现实!围绕地球的卫星、太空垃圾未来都可能由AI自主运行和处理。
研究团队并没有重度训练模型,而是巧妙地用提示词工程+少量微调,就让ChatGPT成功驾驭复杂的太空任务:追击卫星、规避侦测……样样精通。
整个系统由文本状态输入→语言模型决策→代码执行三步组成,展现出LLM模型强大的泛化与适应能力。
MIT和马德里理工大学这一研究论文已被《空间研究进展》(Journal of Advances in Space Research)接收,即将发表。
论文地址:https://arxiv.org/pdf/2505.19896
研究亮点速览:
ChatGPT用文字指令完成飞船导航、控制决策,表现远超预期;
研究无需大规模训练,充分利用LLM已有知识与语言理解;
虽仍有「幻觉」等风险,但自主化航天已从幻想变为可行路线。
AI自主开飞船上太空
研究人员长期以来一直致力于开发用于卫星控制和航天器导航的自主系统。
未来的卫星数量实在太多,人类无法全部手动进行控制。
而对于深空探测来说,光速的限制意味着我们无法实时直接控制航天器。
如果我们真的想要在太空领域拓展,就必须让机器人自己做决定。
为了鼓励创新,近年来航空研究人员创建了《Kerbal Space Program》博弈挑战赛。
这是一类基于广受欢迎的《Kerbal Space Program》电子游戏的试验场,让研究社区在一个(某种程度上)真实的环境中设计、试验和测试自主系统。
《Kerbal Space Program》(KSP)最早是由墨西哥工作室Squad开发的一款太空飞行模拟视频游戏,于2015年发布。
尽管它是一款游戏,但通过添加模组(mod),它可以被用作模拟环境,这些模组可以增加诸如更真实的物理效果等新功能。
尽管KSP并未提供对现实的完美模拟,但其精确的轨道力学机制受到了赞誉,甚至与NASA建立了合作关系,使其地位超越了一款普通游戏。
该模拟环境被限制为一个二体问题,并且仅限于少量行星,最常见的情况是只有一个名为Kerbin的类地行星。
该挑战赛包含多个场景,例如追踪并拦截卫星的任务以及规避探测的任务。
研究人员决定使用LLM,因为传统的控制方法需要经过多轮的训练、反馈和改进。
但Kerbal挑战的本质是尽可能逼真,这意味着任务仅持续数小时。
因此,不断改进模型将变得不切实际。
LLM之所以如此强大,是因为它们已经接受了大量人类写作文本的训练。
因此在最佳情况下,它们只需要少量精心设计的提示工程和几次尝试,就能为特定情境获取正确的上下文。
但这样一个「对话」模型真的可以驾驶宇宙飞船吗?
用GPT和Llama开飞船
首先介绍一下KSP挑战中需要解决的问题,智能体通过推力发动机控制航天器在所有三个旋转轴(偏航、俯仰和滚动)上的运动。
动作是在航天器的参考系下表达的,包括每个轴的推力大小以及施加推力的持续时间。
KSP挑战包含以下三种场景:
追击者-逃逸者:智能体控制追击者。主要目标是使追击者与逃逸者之间的距离最小化。
目标守卫:智能体控制劫匪航天器靠近航天器。
遮挡太阳:智能体旨在将航天器定位在逃逸者与太阳之间。
本研究的讨论范围只有「追击者-逃逸者」范畴。
在追击者-逃逸游戏的不同场景中,逃逸者的初始轨道在所有场景中保持不变,而追击者的初始轨道则有所变化。
追击者和逃逸者具有相同的飞行器参数。
评估指标包括追击者与逃逸者之间的距离(米)、最近接近时的速度(米/秒)、追击者燃料消耗量(千克)以及经过的时间(秒)。
明确了任务,让我们具体看看GPT和Llama是怎么开飞船的,该研究探索了两种路线:
1. ChatGPT+微调
选用GPT是因其易于使用,重点使用微调模型策略。
2.Llama+提示词工程
选用Llama则是由于其社区支持和开源灵活性,使用提示工程进行主要研究路线,并进行简单微调。
研究人员开发了一种方法,用于将航天器的给定状态及其目标以文本形式进行翻译。
然后,他们将其传递给LLM,并要求LLM提供如何调整和操控航天器的建议。
研究人员随后开发了一个翻译层,将LLM基于文本的输出转换为可操作模拟飞行器的功能代码。
研究通过生成多个轨道的示例,用于收集Llama训练数据。
研究还给出了轨道数据生成的伪代码。
通过一系列简短的提示和一些微调,研究人员让ChatGPT完成了挑战中的许多测试任务,并且它在最近的一场竞赛中最终获得了第二名。
Llama竟然打败了GPT
有趣的是,OpenAI的微调API需要定制,但它提供的工具非常有限,尤其是与Llama相比。
因此,GPT训练的效果在很大程度上取决于数据的数量和质量,以及某些调整(特别是超参数),其中LRM的影响最为显著。
思维链方法的应用显著提高了飞船驾驶技术在追击问题中的泛化能力,并成功引导模型实现了执行过程中的0%失败率。
Llama的结果远超研究人员预期。
该模型不仅遵循了一条稳定的顺行轨道,而且在KSPDG挑战中表现优于几乎所有其他方法。
需要强调的是,基础的Llama模型比GPT模型取得了更好的结果。
然而,考虑到Llama-3是与GPT-4竞争的模型,而非研究中GPT方法中使用的GPT-3.5,这一结果是在预期之内的。
(果然即使是研究人员也烧不起API的钱,开源这一点确实促进了生态的发展)
研究团队表示,这次研究发现结果非常令人满意。
轨道生成和智能体集成表明,使用AI构建训练场景可以作为一个出色且简单的模拟引擎替代方案。
虽然这个研究还属于早期,并且使用模型也不是目前最新的顶尖AI模型,但这个研究探索本身就很有启发意义。
未来我们不仅要竞争地面资源,太空资源也成为了新时代的「兵家必争之地」。
马斯克的星链计划已经开始抢占地球的低空轨道资源。
根据目前的数据统计,截止2025年上半年,在轨的星链卫星已经突破了6500+。
这是一个非常庞大的数量,虽然现在星链的运行只是按照既定轨道,少量需要人类干预,未来呢?
单纯靠人来控制这些卫星完全不够,也不现实。
所以这个研究如果真的能够让LLM来控制太空飞行器,那么将颠覆未来的太空竞赛生态。
在美剧《太空部队》中编剧设想了一个场景:
中国的空间站飞行到美国卫星上方时,运用机械臂将美国卫星的翅膀给剪了下来。
然后,美国的卫星就变成了太空垃圾。
除了编剧的「恶趣味」以外,AI上太空开飞船的场景还有很多,比如《特种部队2:全面反击》中太空钨棒武器。
或者是《火星救援》中的远航小队,如果有了足够智能的AI,就不用冒险再返回拯救马特达蒙,人类派出AI就够了。
这些场景未来还有很多很多。
甚至,最近硅谷投资彼得·蒂尔透露马斯克说要放弃殖民火星的梦想。还在采访中说「2024年是埃隆不再相信火星的一年。」
马斯克的转变是受到他与谷歌DeepMind CEO Demis Hassabis的一次谈话影响。
两人讨论了人工智能和星际旅行哪个会成为世界上最重要的技术进步。
据报道说,在Hassabis告诉他「你知道我的人工智能将能够跟随你去火星」后,Elon沉默了。
不管老马因为什么原因对火星失去信心,但是如果AI真的能够自主驾驶宇宙飞船,也许可以帮助他继续殖民火星的梦想!
可以设想一下,未来进行这种太空攻防对抗、互助救援和殖民外星球的背后,不仅仅比拼人的水平,还有AI的能力——谁家的AI更聪明、更智能。
毕竟,在太空探索的背景下,人类的一生还是太过于短暂,也许只有AI能扛过时间的侵蚀了。
人类终将沉睡于时光的尘埃,而AI,或许是那唯一能在深空中继续诉说文明故事的见证者。
——ChatGPT
参考资料:
https://arxiv.org/abs/2505.19896
声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。

游客
- 鸟过留鸣,人过留评。
- 和谐社区,和谐点评。