Bauplan:一个 Python 优先的 Serverless Lakehouse

Bauplan 是一个 Python 化的数据平台,为大规模数据管道提供函数即服务 (functions as a service),并在 S3 数据湖上实现 git-for-data。 Bauplan 负责处理通常需要整个基础设施团队才能完成的任务。 我们的目标是让您和您的团队在云端运行大规模的 ML 工作流、AI 应用和数据转换管道,而无需管理任何数据基础设施。

我们为什么构建它。 我们是一个由 ML 和数据工程师组成的团队,构建 Bauplan 是因为我们亲身体验了在云基础设施上花费太多时间的挫败感。 Bauplan 的构建旨在提供一个 Python 优先的平台,它既非常简单强大

简单。 我们的 Serverless 函数允许您将管道编写为简单的 Python 函数链,而无需处理容器化、运行时配置和像 Spark 这样的专用大数据框架。

强大。 通过使用 Git-for-data 和我们独特的 Refs 系统,我们确保每个管道运行、每个表和每个模型都会自动进行版本控制、可重现和可审计。

主要特性

使用场景

运行 AI 应用、ML 工作负载和数据管道。 在这里,您将找到许多示例,展示了我们的客户如何使用该平台来解决现实世界中的问题。