用于工程的 LLM:教模型设计高功率火箭
arXiv:2504.19394 (cs) [提交于2025年4月27日 (v1), 最近修订于2025年4月29日 (此版本, v2)]
标题: LLMs for Engineering: Teaching Models to Design High Powered Rockets
作者:Toby Simonds
查看由 Toby Simonds 撰写的论文 "LLMs for Engineering: Teaching Models to Design High Powered Rockets" 的 PDF 版本 View PDF HTML (实验性)
摘要: 大型语言模型 (LLMs) 已经改变了软件工程,但它们在物理工程领域的应用仍有待探索。本文通过 RocketBench (一个将 LLMs 连接到高精度火箭模拟的基准) 评估了 LLMs 在高功率火箭设计中的能力。我们在两个日益复杂的设计任务上测试模型:目标高度优化和精确着陆挑战。我们的研究结果表明,虽然最先进的 LLMs 表现出强大的基线工程知识,但在获得模拟结果后,它们难以迭代其设计,并最终停滞在低于人类表现的水平。然而,当通过强化学习 (RL) 增强时,我们表明一个 7B 参数模型优于 SoTA 基础模型和人类专家。这项研究表明,经过 RL 训练的 LLMs 可以作为复杂工程优化的有效工具,有可能改变软件开发以外的工程领域。 Subjects: | Software Engineering (cs.SE); Artificial Intelligence (cs.AI) ---|--- Cite as: | arXiv:2504.19394 [cs.SE] (or arXiv:2504.19394v2 [cs.SE] for this version) https://doi.org/10.48550/arXiv.2504.19394 Focus to learn more arXiv-issued DOI via DataCite
Submission history
From: Toby Simonds [view email] [v1] Sun, 27 Apr 2025 23:59:39 UTC (638 KB) [v2] Tue, 29 Apr 2025 22:15:42 UTC (638 KB) Full-text links:
Access Paper:
View a PDF of the paper titled LLMs for Engineering: Teaching Models to Design High Powered Rockets, by Toby Simonds