Show HN: Pi Co-pilot – 轻松评估 AI 应用
我可以帮你评估什么?
访问用于评估、可观测性和 Agent 控制的最佳模型。
示例文件:
- Trip Planning Agent
- Product Marketing Agent Comparison
- Blog posts in the style of...
受信任的公司:
正在上传...
您的视频文件正在上传。当前加载的视频是源文件。
- 与 Pi 的 copilot 合作构建你的评分系统。
- 使用 Pi 的评分系统来评估你技术栈中的任何内容。
为什么选择 Pi 的评分模型?
- 你可以信任的指标,可用于离线评估和在线推理。
- 对你的应用非常智能。
不确定要衡量什么?Pi 会为你找出答案。向它提供你的任何或所有 Prompts、PRD、用户反馈,或者只是坐下来与它聊天,它将帮助你找出适合你的应用程序的最佳校准指标。
- 高度准确。 速度极快。 点击查看
我们的基础模型 Pi Scorer,比 Deepseek 和 GPT 4.1 评分更准确,但运行速度和大小与 GPT Mini 和 Gemini Flash 相当。 你可以在不到 100 毫秒的时间内对 20 多个自定义维度进行评分;它就是这么快。
- 一个评分器;所有集成。 点击查看
单个 Pi Scorer 可用于你的 AI 技术栈和现有工具的每个部分:离线评估、在线可观测性、训练数据质量、模型优化、Agent 控制流程等等。 轻松将 Pi 插入到 Google Spreadsheets、Promptfoo、CrewAI 或你可能正在使用的任何其他工具中。
来自为你带来 Google Search 魔法的团队
我们花费了数十年的时间利用最新的研究来构建高质量的 AI 和搜索引擎。 我们很高兴将我们的专业知识和经验放在你的指尖!
David Karam
Founder & CEO
此前,作为 Google 的产品总监,David 领导了一个产品管理团队,与一个 200 多名工程师的组织合作,开发 AI、LLM 和搜索平台,与 Search、Shopping 和 Geo 团队合作,推动搜索产品创新。
Achint Srivastava
Founder & CTO
在加入 Pi Labs 之前,Achint 曾是 Google 的首席软件工程师,领导着一个 250 多人团队的技术愿景。 Achint 构思并构建了 AI 和搜索平台,包括为 Search Generative Experience 和 Google Cloud Search 等功能提供支持的 GenAI。