Y Combinator

Datafold

解决 pull request 中的分析数据质量问题

高级软件工程师 - AI Agents

$175K - $245K 地点 远程 (美国) 职位类型 全职 经验 3年以上

直接与 YC 资助的优秀初创公司的创始人联系。 申请职位 › Gleb Mezhanskiy Gleb Mezhanskiy 创始人

关于这个职位

Datafold 是一家快速增长的 A 轮初创公司,处于数据质量和可观察性领域的前沿——可以将其理解为数据工程师的 Datadog。 凭借包括 YC、Amplify 和 NEA 在内的顶级投资者的支持,我们正在重新定义 Disney、FanDuel 和 Perplexity 等公司如何在整个数据生命周期中保持质量。 虽然总部位于美国,但我们是一个完全远程的团队,员工遍布美国和欧盟。

我们正在寻找一位经验丰富的后端(或全栈)工程师来帮助构建和扩展 Datafold Migration Agent (DMA)——这是一款由 AI 驱动的工具,正在改变数据迁移的游戏规则。 DMA 将大型语言模型与我们独特的数据差异技术相结合,可自动执行 SQL 方言转换和数据核对,从而将迁移时间缩短 5-10 倍,并消除对手动工作和昂贵顾问的需求。

职位职责

关于你

如果您对构建一个在 AI 和数据工程交叉领域具有高度影响力的创新产品感到兴奋,我们很乐意听到您的声音。

Datafold 是一家提供平等机会的雇主,不会因种族、肤色、宗教、性别、国籍、年龄、残疾、遗传信息、性取向、性别认同、婚姻状况、兵役状况或任何其他受保护的特征而歧视任何员工或求职者。 我们致力于为所有人提供平等的就业机会。 我们努力创造一个包容和多样化的工作环境,让所有员工都受到重视,并且独特的观点得到尊重和庆祝。

关于 Datafold

在 Datafold,我们为数据从业者构建工具,以自动化数据工程工作流程中最容易出错且最耗时的部分:测试数据以保证其质量。 虽然数据质量(就像软件质量一样)是一个复杂且多方面的问题,但我们借鉴了我们团队在数据领域数十年的综合经验来构建用户喜爱的有见地的工具。 具体来说,我们相信:

数据质量是优秀数据工程工作流程的副产品。 这意味着,我们不是为数据从业者构建另一个需要来回切换的应用程序,而是将我们的工具插入到现有的工作流程中,例如,用于部署测试的 CI/CD 和用于开发期间测试的 IDE。

数据质量问题应在部署代码之前解决。 大多数数据质量问题都是处理数据的代码中的错误,并且采用主动的、向左移的方法是同时实现高购物速度和数据质量的最有效方法。 阅读更多

缺乏元数据(关于数据的数据)是数据工程工作流程中最大的差距。 我们将强大的工具(例如数据差异和列级别沿袭)引入到每个数据工程师的工作流程中,以帮助他们验证代码和底层数据,并充分了解复杂数据管道中的依赖关系。

Datafold 被 Patreon、Thumbtack、Substack、Angellist 等的数据团队使用,并从 YC、NEA 和 Amplify Partners 筹集了 2200 万美元。 Datafold Datafold 成立于:2020 团队规模:24 状态:活跃 地点:纽约

创始人 Gleb Mezhanskiy Gleb Mezhanskiy 创始人 Alex Morozov Alex Morozov 创始人