Paper2Code:自动化生成机器学习科学论文代码
arXiv:2504.17192 (cs) [2025年4月24日提交]
标题: Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning
作者: Minju Seo, Jinheon Baek, Seongyun Lee, Sung Ju Hwang
查看由 Minju Seo 和其他 3 位作者撰写的题为 Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning 的论文的 PDF 版本。 查看 PDF HTML (实验性)
摘要:尽管机器学习研究发展迅速,但相应的代码实现通常不可用,这使得研究人员重现结果并在先前工作的基础上进行构建变得缓慢且费力。与此同时,最近的大型语言模型 (LLMs) 擅长理解科学文档并生成高质量的代码。受此启发,我们推出了 PaperCoder,这是一个多代理 LLM 框架,可将机器学习论文转换为功能性代码仓库。PaperCoder 分三个阶段运行:计划,它构建高级路线图,使用图表设计系统架构,识别文件依赖项,并生成配置文件;分析,侧重于解释特定于实现的细节;以及生成,生成模块化的、依赖项感知的代码。此外,每个阶段都通过一组专门的代理来实例化,这些代理旨在在整个pipeline中有效协作。然后,我们基于基于模型和人工评估,特别是来自原始论文作者的评估,评估 PaperCoder 从机器学习论文中生成代码实现的效果,如果可用,则以作者发布的仓库作为ground truth。我们的结果证明了 PaperCoder 在创建高质量、忠实实现方面的有效性。此外,它在最近发布的 PaperBench 基准测试中始终表现出优势,大幅超越了强大的基线。
主题:| 计算与语言 (cs.CL) ---|--- 引用为:| arXiv:2504.17192 [cs.CL] (或 arXiv:2504.17192v1 [cs.CL],对于此版本) https://doi.org/10.48550/arXiv.2504.17192 通过 DataCite 了解更多 arXiv 发布的 DOI(待注册)
提交历史
来自:Minju Seo [查看电子邮件] [v1] 2025 年 4 月 24 日星期四 01:57:01 UTC (1,206 KB)
全文链接:
访问论文:
查看由 Minju Seo 和其他 3 位作者撰写的题为 Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning 的论文的 PDF 版本。