Navigation Menu

切换导航

parsaghaffari / **browserbee ** Public

🐝 AI驱动的浏览器助手 ("Web浏览的 Cline")

License

Apache-2.0 license 156 stars 5 forks Branches Tags Activity

Additional navigation options

parsaghaffari/browserbee

main BranchesTags

Go to file Code

Folders and files

Name | Name | Last commit message | Last commit date ---|---|---|---

Latest commit

History

179 Commits .github/workflows | .github/workflows docs | docs public | public src | src .gitignore | .gitignore .nojekyll | .nojekyll ARCHITECTURE.md | ARCHITECTURE.md CONTRIBUTING.md | CONTRIBUTING.md LICENSE | LICENSE README.md | README.md ROADMAP.md | ROADMAP.md package-lock.json | package-lock.json package.json | package.json reattach-button.png | reattach-button.png tailwind.config.js | tailwind.config.js tsconfig.json | tsconfig.json vite.config.ts | vite.config.ts View all files

Repository files navigation

BrowserBee 🐝

你的浏览器内AI助手。用自然语言控制网络。

BrowserBee.mp4

BrowserBee 是一个注重隐私的开源 Chrome 扩展,它允许你使用自然语言控制你的浏览器。它结合了 LLM 的指令解析和规划能力,以及 Playwright 强大的浏览器自动化功能来完成任务。

由于 BrowserBee 完全在你的浏览器中运行(除了 LLM),它可以安全地与已登录的网站(如你的社交媒体帐户或电子邮件)交互,而不会损害安全性或需要后端基础设施。这使得它比其他“浏览器使用”类型的产品更方便个人使用。

🎲 Features

🕹️ Supported tools

Navigation Tools

Tab Context Tools

Interaction Tools

Observation Tools

Mouse Tools

Keyboard Tools

Tab Tools

Memory Tools

✅ Use Cases

🛫 Roadmap

请参考 ROADMAP.md 获取我们计划添加到 BrowserBee 的最新功能列表。

如果你有兴趣贡献构建这些功能中的任何一个,或者以任何方式改进 BrowserBee,请前往 CONTRIBUTING.md

▶️ Installation

你有三种安装 BrowserBee 的选择:

Option 1: Download the latest release (Recommended)

  1. GitHub Releases 下载最新版本
  2. 解压缩下载的文件
  3. 在 Chrome 中加载扩展:
    • 转到 chrome://extensions/
    • 启用 “开发者模式”(在右上角切换)
    • 单击 “加载未打包的扩展程序” 并选择解压缩的目录
    • 在弹出的选项页面中设置你的 LLM API 密钥(对于 Anthropic、OpenAI、Gemini)和/或配置 Ollama。

Option 2: Build from source

  1. 克隆此存储库
  2. 使用 npm installpnpm install 安装依赖项(这需要约 3 分钟)
  3. 使用 npm run buildpnpm build 构建扩展
  4. 在 Chrome 中加载扩展:
    • 转到 chrome://extensions/
    • 启用 “开发者模式”
    • 单击 “加载未打包的扩展程序” 并选择 dist 目录
    • 在弹出的选项页面中设置你的 LLM API 密钥(对于 Anthropic、OpenAI、Gemini)和/或配置 Ollama。

Option 3: Chrome Web Store (Coming Soon)

BrowserBee 很快将在 Chrome Web Store 上可用,等待审核。 获得批准后,你将能够通过单击一下直接从商店安装它。

🏃‍♂️ Usage

  1. 单击 Chrome 工具栏中的 BrowserBee 图标,或按 Alt+Shift+B,以打开侧面板
  2. 输入你的指令(例如,“转到 Google,搜索 Cicero,然后单击第一个结果”)
  3. 按 Enter 并观看 BrowserBee 开始工作 🐝

Note:

  1. 由于 BrowserBee 使用 Chrome DevTools Protocol (CDP) 连接到选项卡,因此最好将其连接到一个基本选项卡,该选项卡在整个会话中保持打开状态(如果需要,BrowserBee 可以打开新选项卡)。 如果你关闭了连接的选项卡,请使用 reattach button 按钮重新连接到新选项卡。
  2. 每个 Chrome 窗口可以运行一个 BrowserBee 实例,并且这些实例将彼此隔离工作。
  3. BrowserBee 无法连接到没有 URL 的选项卡(例如,新选项卡),或 URL 以 “chrome://” 或 “chrome-extension://” 开头的选项卡。

🫂 Acknowledgements

BrowserBee 是使用这些出色的开源项目构建的:

💡 Learnings & what's worth stealing

  1. Running Playwright in the browser. Playwright 为 LLM 提供了一个强大而标准的接口,用于与现代网站和 Web 应用程序交互。 我遇到的大多数 “浏览器使用” 方法(例如 Browser UsePlaywright MCP)主要设计用于以后端服务浏览器的方式远程控制浏览器,这对于企业自动化来说非常强大,而 @ruifigueira 已经表明,我们可以使用浏览器扩展整齐地包装 Playwright,并降低最终用户用例的复杂性。
  2. "Reflect and learn" memory pattern. 某些设置在 AI agent 的反馈方面非常丰富。 这是其中之一,agent 不仅具有广泛的工具来与环境交互,而且还具有强大的观察能力来了解其行为对环境的影响。 例如,如果 agent 的任务是完成产品购买,那里很可能通过使用不同的工具(例如鼠标和键盘交互)强行实现最终目标,通常可以通过定期截取屏幕截图来判断其是否已成功完成任务。 这里对 agent 来说是一个有价值的学习信号,通过调用 agent 来编码和记忆这些学习内容,我们可以增强未来的性能并提高类似任务的效率,尤其是对于较小的、功能较弱的模型。 在我有限的测试中,如果我们记住最佳工具序列,有时可以将任务所需的 token 数量(以及成本)减少 5 倍或更多。
  3. Interacting with web pages remains a hard task for LLM-powered agents. DOM 和屏幕截图是复杂、低信息密度的模式,对于 LLM 来说处理速度慢、成本高且具有挑战性。 例如,将网页与一段代码进行比较:一段代码中的每个 token 平均比 HTML 页面中的 token 或屏幕截图中的像素携带更多信息。 因此,我们需要巧妙简化的表示形式以及更便宜/更快的模型,才能使此类产品完全可行。
  4. Why use an LLM at all?. 在这种情况下,LLM agent 可以提供的核心价值在于 发现 完成任务的路径或操作序列,然后可以将其编码为一组工具调用,或者实际上是纯 JavaScript(请参阅 Playwright Codegen); 一旦知道序列,遵循它就很简单 - 不需要 LLM。
  5. Privacy-first personal AI tools are the way to go. 毫无疑问,我们大多数人将来都会拥有某种形式的永久在线 AI 仆人,而且我认为我们能够安全地实现这一目标的唯一方法是通过与我们的数据和 LLM 透明交互的开源软件。 构建这种类型的软件和支持它的商业模式(例如,提供托管版本)有很多空间,所以我真的希望看到和使用更多强大的开源 AI 助手。

📜 License

Apache 2.0

About

🐝 AI驱动的浏览器助手 ("Web浏览的 Cline")

Resources

Readme

License

Apache-2.0 license Activity

Stars

156 stars

Watchers

4 watching

Forks

5 forks Report repository

Releases 1

BrowserBee 0.2.0-beta Release Notes Latest May 18, 2025

Packages 0

No packages published

Contributors 3

Languages

Footer

GitHub © 2025 GitHub, Inc.

Footer navigation

You can’t perform that action at this time.