Show HN: Workflow Use – 确定性的、自修复的浏览器自动化 (RPA 2.0)
该项目名为 **Workflow Use**,旨在创建和运行确定性的、自修复的浏览器自动化 workflows,即 RPA 2.0。用户可以通过录制浏览器交互来生成 workflows,实现一次录制、永久重用。它能将录音转化为结构化、可执行的 workflows,并具备类人交互理解能力。项目目前处于早期开发阶段,未来计划包括改进 workflows、开发者体验和 Agent 功能,目标是实现自动化,让计算机能够重复执行任务,无需人为干预。
browser-use / **workflow-use ** Public
⚙️ 创建和运行 workflows (RPA 2.0) browser-use.com
License
确定性的、自修复的 Workflows (RPA 2.0)
⚙️ Workflow Use 是创建和执行确定性 workflows 的最简单方法,它具有变量,如果步骤失败,则会回退到 Browser Use。你只需展示给 recorder 这个 workflow,我们就会自动生成 workflow。
❗ 此项目尚处于非常早期的开发阶段,因此我们不建议在生产环境中使用。许多事情都会发生变化,我们还没有发布时间表。最初,该项目源于客户的需求,即让 Browser Use 更加可靠和确定。
快速开始
git clone https://github.com/browser-use/workflow-use
构建扩展
cd extension
npm install
npm run build
设置 workflow 环境
cd workflows
uv sync
playwright install chromium
cp .env.example .env
运行 cli
python cli.py --help
演示
Workflow Use 瞬间填写表单
workflow-use-demo.mp4
Gregor 的解释
workflow-use-gregor-demo.mp4
特性
- 🔁 一次录制,永久重用:录制一次浏览器交互,并无限期地重播。
- ⏳ 展示,无需提示:无需花费数小时来提示 Browser Use 反复做同样的事情。
- ⚙️ 结构化和可执行的 Workflows:将录音转换为确定性的、快速的和可靠的 workflows,这些 workflows 自动从表单中提取变量。
- 🪄 类人交互理解:智能地过滤录音中的噪声,以创建有意义的 workflows。
- 🔒 企业级基础:专为未来的可扩展性而构建,具有自修复和 workflow 差异等功能。
愿景和路线图
向计算机展示它需要做什么一次,它就会一遍又一遍地做,而不需要任何人为干预。
Workflows
- 在 Python 代码中使用
.json
文件的良好方式。 - 改进步骤失败时的 LLM 回退(目前非常糟糕)。
- 自我修复,如果失败,agent 会自动介入并更新 workflow 文件。
- 更好地支持 LLM 步骤。
- 获取前一步骤的输出,并将其用作下一步骤的输入。
- 将 workflows 作为 MCP 工具公开。
- 使用 Browser Use 从网站自动创建 workflows。
开发者体验
- 改进 CLI。
- 改进扩展。
- 步骤编辑器。
Agent
- 允许 Browser Use 使用 workflows 作为 MCP 工具。
- 使用 workflows 作为网站缓存层。
关于
⚙️ 创建和运行 workflows (RPA 2.0) browser-use.com