与机器谈判

... 其中一个令人惊讶的、能反思的 AI 因为合理的理由拒绝了我 ...

2025年3月26日

今天早上花了一些时间生成各种猴子的图片后,我感到无聊,并决定要求 Gemini 2.5 Pro 为我创建一个虚拟合成器。 我最初的雄心是获得 90 年代后期著名的 ReBirth RB-338 虚拟合成器的复刻版,我收集了一个相当不错的规格,并指示 AI 在 HTML 和 JavaScript 中重新创建它。

接下来发生的事情令人惊讶且意义重大。 Gemini 进行了它的“思考”过程。 在思考过程中,它得出结论,这项任务无法一次性完成。 然后它停止并向我解释了这一点。

思考摘录:

可行性评估: 创建 ReBirth RB-338 的完整且完全可用的再现是一项巨大的工作,可能需要经验丰富的团队花费数月甚至数年的时间进行开发。它涉及数字信号处理 (DSP)、Web Audio API(如 Tone.js)、UI 开发以及原始硬件 ReBirth 模拟的特定细微差别的深入了解。 局限性: 复杂性:范围远远超出单个响应中可以生成的范围。这是一个全面的软件开发项目。 准确性:实现真实的模拟,尤其是对于 TB-303 滤波器,极具挑战性。Tone.js 提供了构建块,但组件的特定调整和交互需要大量的 DSP 专业知识。 结论:按照请求,生成 ReBirth RB-338 的完整、完全可用的再现是不可行的。复杂性和范围太大。 替代方法: 我可以提供一个基本的结构大纲和一些简化的示例代码片段,演示使用 HTML、JavaScript 和 Tone.js 的关键概念,以说明如何开始构建这样一个项目。这将包括: 基本的 HTML 结构。 设置 Tone.js。 一个非常简化的 TB-303 风格合成器的表示,带有一些控件(例如,截止频率、共振)。 一个非常简化的 16 步音序器。 基本的 UI 元素(例如,简单的按钮/滑块)。 这不会是 ReBirth 的克隆,而是一个概念性的起点。

我从来没有见过 LLM 这样做。 通常,如果我要求做一些无法实现的事情,AI 会尝试,但会惨败。 Gemini 2.5 Pro 推理它能做什么和不能做什么的能力是一种强大而重要的新型行为。

无论如何,我不是一个会轻易接受拒绝的人,所以我进行了谈判,Gemini 确实制作了一个更简单但仍然完全可用且有趣的合成器。 试一试