[Arroyo 加入!Cloudflare logo Cloudflare,将流处理带给所有人](https://www.arroyo.dev/blog/</blog/arroyo-is-joining-cloudflare>) Arroyo Logo 文档 DocumentationGetting StartedSQLAPIDeployment 博客 关于我们 Discord 文档 DocumentationGetting StartedSQLAPIDeployment 博客 关于我们 Discord GitHub

博客

来自 Arroyo 团队的更新

Arroyo 加入 Cloudflare

2025 年 4 月 10 日 Arroyo 已被 Cloudflare 收购,旨在将 serverless SQL 流处理引入 Cloudflare Developer Platfrorm,并与 Queues、Workers 和 R2 集成。 Arroyo Engine 将保持开源和可自托管。 Micah Wylde Micah Wylde Arroyo 的 CEO 我非常激动地宣布,Arroyo 已被 Cloudflare 收购,我们将继续致力于将流处理带给所有数据工作者。

简而言之:Arroyo 将进入 Cloudflare 的 Developer Platform。 您将在一个完全托管的平台上获得相同的有状态聚合、连接和转换,该平台与 Cloudflare QueuesR2 object storageWorkers-powered UDF 无缝集成。 Arroyo 将保持完全开源和可自托管。

对于那些主要将 Cloudflare 视为现代互联网支柱的人来说,这听起来可能是一个奇怪的组合。DDoS 保护和 CDN 与数据处理有什么关系?我也有类似的困惑。但当我们开始讨论合作时,我了解到 Cloudflare 的雄心壮志远不止于此:构建一种新型云,围绕其全球计算和存储网络而设计。在过去一年中的多次对话中,我清楚地意识到,没有比这里更好的地方来构建下一代数据平台了。

一些背景

让我们稍微回顾一下。 Jackson 和我于 2022 年创立了 Arroyo,旨在普及实时数据处理。

现代公司依靠数据 pipelines 来驱动其应用程序和业务,从用户定制、推荐和反欺诈,到新兴的 AI agent 领域。 但如今,这些 pipelines 大多以批处理方式运行,每小时、每天甚至每月运行一次。 在 Lyft 和 Splunk 等公司从事流处理多年之后,为什么会这样就不足为奇了:对于开发人员和数据科学家来说,构建正确、高性能且可靠的 pipelines 实在太难了。 大型科技公司聘请流媒体专家来构建和运营这些系统,但其他所有人都在等待批处理的到来。

当我们开始时,流式 pipelines 的主要解决方案(也是我们在 Lyft 和 Splunk 运行的方案)是 Apache Flink。 Flink 是第一个成功地将容错(能够从故障中一致地恢复)、分布式(跨多台机器)、有状态(并记住有关过去事件的数据)数据流与图形构建 API 相结合的系统。 这种功能的结合意味着我们终于可以构建强大的实时数据应用程序,具有窗口、聚合和连接等功能。 但虽然 Flink 拥有必要的能力,但在实践中,API 对于非专业用户来说过于困难和低级,并且由此产生的服务的有状态性质需要无休止的运营。

我们意识到我们需要构建一个新的流引擎——一个具有 Flink 的强大功能,但专为产品工程师和数据科学家设计,并在现代云基础设施上运行的引擎。 我们从 SQL 作为我们的 API 开始,因为它易于使用、广为人知且具有声明性。 我们用 Rust 构建它,以实现速度和操作简单性(无需 JVM 调优!)。 我们构建了一个对象存储原生的状态后端,简化了运行有状态 pipelines 的挑战——每个管道都像一个奇怪的、专门的数据库。

然后在 2023 年夏天,我们将其开源。 如今,数十家公司正在运行 Arroyo pipelines,用例包括数据摄取、反欺诈、IoT 可观察性和金融交易。

我们一直都知道引擎只是难题的一部分。 为了使流式传输像批处理一样容易,用户需要能够开发和测试查询逻辑,在历史数据上进行回填,并以 serverless 方式部署,而无需担心集群大小或持续运营。 普及流式传输最终意味着构建一个完整的数据平台。 我们意识到,Cloudflare 已经拥有所有其他部分:R2 提供用于状态和静态数据的对象存储,Queues 用于传输中的数据,Workers 用于安全有效地运行用户代码。

下一步是什么

在短期内,Arroyo 团队将致力于将该引擎与 Cloudflare 的计算基础设施集成,从而将 SQL 处理功能引入 Cloudflare Pipelines(今天推出 beta 版)。Arroyo 引擎将保持完全开源(Apache 许可),并支持在 VMsKubernetesserverless container platforms 上进行自托管。

虽然这项工作的大部分将是 Cloudflare 特有的,但我们将继续为 Arroyo 开源贡献修复和功能。 我们将共同拥有更多的资源来投资于稳定性、性能和可操作性,我们希望看到该项目和社区在这个新时代继续蓬勃发展。

我们非常感谢所有帮助我们走到今天的人——我们的员工、投资者、贡献者、支持者和朋友。 我要特别感谢我们的早期用户,他们对一个年轻的数据基础设施进行了押注,使我们有可能将 Arroyo 构建成今天的样子。

这是我们创业之旅的终点,但这仍然只是我们重塑数据处理使命的开始。 这是我们成立公司以构建的 serverless 流处理平台,我们非常高兴能与 Cloudflare 一起完成。 Arroyo logo ©2025 Arroyo Systems 产品 DocumentationGetting StartedAPIGitHub 公司 About UsBlogDiscord 法律 Privacy PolicyTerms of Service 保持更新