Airbnb 如何衡量房源的 Lifetime Value (LTV)

How Airbnb measures listing lifetime value

Source | HN Comments

文章介绍了 Airbnb 如何衡量房源的 Lifetime Value (LTV)，用于识别对客人有价值的房源。文章构建了包含 baseline LTV、incremental LTV 和 marketing-induced incremental LTV 的框架。其中，baseline LTV 估算未来365天内的预订量，incremental LTV 考虑房源间的交易影响，marketing-induced incremental LTV 衡量内部营销活动带来的价值。文章还讨论了准确估计 LTV 面临的挑战，如数据准确性、增量衡量以及处理不确定性，并介绍了 Airbnb 应对这些挑战的策略，例如使用机器学习模型、生产函数和动态更新 LTV 估算。

Airbnb 如何衡量房源的 Lifetime Value (LTV)

本文深入探讨了我们用于识别对客人最有价值的房源的框架。

作者： Carlos Sanchez-Martinez, Sean O’Donnell, Lo-Hua Yuan, Yunshan Zhu

在 Airbnb，我们始终致力于为我们的社区提供最佳体验。为此，了解哪种类型的住宿房源对我们的客人有价值非常重要。我们通过计算和使用 listing lifetime value (LTV) 的估算值来实现这一点。这些估计不仅使我们能够确定哪些类型的房源最能引起客人的共鸣，还可以帮助我们为主持人开发资源和推荐，以提高其房源的价值。

大多数关于 lifetime value 的现有文献都侧重于传统的销售渠道，其中单个卖家与多个买家进行交易（例如，零售商向客户销售服装）。相比之下，这篇博文解释了我们如何在像 Airbnb 这样的平台中对 lifetime value 进行建模，其中有多个卖家和买家。在第一部分中，我们将描述我们通用的房源 lifetime value 框架。在第二部分中，我们将讨论在实践中应用此框架时的相关挑战。

我们的 Listing Lifetime Value 框架

我们的 listing lifetime value (LTV) 框架估计三个不同的感兴趣的量：baseline LTV、incremental LTV 和 marketing-induced incremental LTV。

(1) Baseline LTV

为了衡量 LTV，我们需要定义“价值”的含义以及构成“lifetime”的时间范围。为了本博文的目的，稍微简化一下，我们将我们的 baseline listing LTV 定义并估计为房源在未来 365 天内在 Airbnb 上进行的总预订量。

我们依靠机器学习以及我们拥有的关于房源的丰富信息来估计每个单独房源的这个量。在实践中，我们还遵循财务指导，通过将结果预测到未来并将相关的贴现率应用于未来价值来得出当前价值。

表 1 显示了一些假设的 baseline LTV 估算值。从示例中可以看出，LTV 不是静态的，并且会随着我们提高估算的准确性、观察市场变化甚至开发房源（例如，通过提供帮助房东改进房源以获得更多预订的指导）而不断发展。

表 1. 房源 LTV 估算示例

我们使用 baseline LTV 估计来分割我们的房源，并确定哪种类型的房源最能引起我们客人的共鸣。这为我们的供应扩展策略提供了信息。我们还使用 baseline LTV 来识别预计无法充分发挥其预订潜力并且可能会受益于额外指导的房源。

(2) Incremental LTV

在估计 lifetime value 时，我们面临着多边市场中常见的挑战：一个房源进行的交易可能会以牺牲另一个房源的交易为代价。例如，当一个新房源加入我们的市场时，该房源将从以前预订其他房源的客人那里获得一些预订。如果我们想准确衡量每个房源增加了多少价值，我们需要考虑这种动态。

我们通过创建“incrementalLTV”估算来解决这一挑战。我们将没有房源参与的情况下不会发生的额外交易称为“incremental value”，并将即使没有房源参与也会发生的交易称为“cannibalized value”。我们通过从 baseline LTV 中减去 cannibalized value 估算来估计房源的 incremental LTV。在讨论测量挑战时，我们将更详细地解释这种调整。

图 1. Cannibalization。 在这种情况下，cannibalization 是指即使没有房源参与市场也会发生的交易。例如，当一个新房源加入平台时，如果新房源没有加入，该房源获得的一些预订将在平台上其他房源进行。

(3) Marketing-induced incremental LTV

Lifetime value 不是静态的，我们的 LTV 模型需要告诉我们内部举措如何带来额外的房源价值。例如，假设我们开展了一项营销活动，为主持人提供有关如何成功改进其房源的技巧。为了了解该活动的回报，我们需要衡量由于该活动而产生的价值，以及没有我们的营销干预会自然产生的价值。我们计算“marketing-induced incremental LTV”来衡量我们的内部举措创造了多少额外的房源 LTV。

在概述了我们的衡量框架（如图 2 所示）之后，我们现在介绍在实践中应用此框架时面临的一些技术挑战。

图 2. 房源 LTV 框架

衡量房源 Lifetime Value 时的挑战

挑战 (1)：准确衡量 Baseline LTV

我们框架最重要的要求是准确估计 baseline LTV。图 3 说明了我们的估计设置。首先，我们利用在估计时间 t 拍摄的房源特征快照。此数据包括我们拥有的关于每个房源和房东的丰富知识（可用性、价格、位置、房东资历等）。然后，我们使用这些特征来训练我们的机器学习模型。作为 value label，我们使用在下一个 365 天内进行的预订数量，该数量在日期 t + 365 观察到。

图 3. Label vs. Feature Collection。 我们的 label 在我们收集模型的初始特征集后的 365 天落地。

此设置具有两个重要的含义，它们会影响准确性和评估：

我们必须等待 365 天才能完全评估预测的准确性。
如果我们观察到在捕获训练数据的时间和我们对模型进行评分的时间之间存在冲击，那么我们的初始训练数据可能不允许我们做出准确的预测。

实际上，在 COVID-19 大流行期间，我们充分感受到了这些影响的后果，当时旅行停止，市场动态发生了巨大变化。我们的模型在大流行之前的训练数据与我们在大流行之后收集的评分数据相比具有截然不同的特征。在处理这种冲击时，我们实施了各种策略来帮助我们提高模型准确性：

减少训练窗口，使我们能够减少模型漂移。
向模型提供细粒度的地理数据和人为提供的关于外部因素的信息，因为由于大流行，边界关闭和重新开放。
采用 LightGBM，它可以处理高基数特征，例如前面提到的地理变量。

挑战 (2)：衡量增量

衡量增量具有挑战性，因为我们永远无法观察到 ground truth。虽然我们观察到每个房源进行了多少预订，但我们无法分辨哪些预订是增量的，哪些预订是从其他房源那里 cannibalized 的。

由于我们没有增量 label 来直接估计此结果，因此我们改为估计生产函数。直观地说，增量在很大程度上取决于我们连接市场双方的能力。生产函数使我们能够识别何时我们的房源供应和客人的需求连接起来并提供增量价值。当一个 segment 具有较高的客人需求和相对较低的房源供应时，增量估计值将很高。相比之下，当 segments 具有大量的房源供应和相对较低的需求时，增量将很低，这意味着客人可以轻松找到住宿地点，并且新房源更有可能 cannibalize 其他房源的预订。

具体来说，我们对我们的房源总供应量 (S) 和客人的总需求量 (D) 如何影响我们的目标结果预订量 (O) 进行建模，如公式 (1) 所示：

我们使用在内部定义的、需求重叠很少的 segments 中汇总的历史供应、需求和结果数据来估计此模型。在估计了模型 (1) 之后，我们计算额外的房源供应如何在给定的 segment 中产生额外的预订：这是我们对增量的估计。

挑战 (3)：处理不确定性

为了处理我们在大流行期间经历的不确定性，我们开始根据房源获得的预订数量多于或少于最初预期来更新我们的 LTV 估计。这种方法帮助我们捕捉在做出初始预测后发生的任何冲击。

为了展示这有多么有用，让我们回到我们的营销活动示例。假设我们运行此活动六个月，并且我们通过将 marketing-induced incremental LTV 与我们在该活动中的总营销投资进行比较来衡量该活动的成功。作为第一种方法，我们可以使用在房源首次成为我们的举措的目标时估计的初始 baseline LTV 数字（这些数字会输入到 marketing-induced LTV 中）。但是，在活动结束且我们评估成功时，营销活动第一天定位的房源将有六个月的预订历史。一种更准确的方法是使用初始预测后实现的预订来开始纠正模型错误。

表 2 说明了它是如何工作的。假设在 2024-01-01，我们预计房源 A 到年底将获得总共 16 个预订。如果在 365 天期间的六个月内，房源 A 收到了 16 个预订，我们应该将其预期价值向上调整到，例如，21 个预订。事实上，在 2024-01-01 之后的 365 天内的每一天，我们都可以查看房源 A 累积的预订并相应地调整预期预订。通过构建，预期预订和累积预订在初始预订日期后的 365 天收敛到最终预订。回到我们的营销示例，如果房源 A 最终收到 20 个预订，则更新初始估计意味着我们从第 0 天的 20% 低估变为截至第 6 个月的更合理的 5% 高估。

表 2. 我们如何更新房源 lifetime value 估算的示例。

在实践中，我们会根据房源的累积价值、更新的房源特征以及使用历史数据估计的类似房源的价值到达模式，每天对房源的预期价值进行调整。

结论

在这篇博文中，我们解释了我们在 Airbnb 如何处理房源 lifetime value。我们介绍了我们的衡量框架，包括 baseline LTV、incremental LTV 和 marketing-induced incremental LTV。我们还深入研究了衡量挑战，例如在 COVID 大流行期间旅行模式发生巨大变化以及准确估计 LTV 变得更加困难。

估计每个房源的 lifetime value 非常重要，因为它有助于我们更有效地为我们的社区提供服务。用例包括：

识别独特的房源 segments，新房东可以通过这些 segments 向大量客人展示他们的热情款待。
查明房源有机会获得更多预订并且可能会受益于额外需求的地点。
确定哪些内部营销举措为我们的社区带来最大的价值。

还值得注意的是，我们的衡量框架可能会扩展到其他应用程序，例如 Airbnb Experiences 房源的 lifetime value，其中体验房源的价值将在很大程度上取决于旅行趋势和客人发现这些体验的能力。

我们每天都在继续解决围绕 LTV 的有趣问题（并且随着更多见解的出现，我们将继续在我们的博客上分享它们）。你能想象自己在这里产生影响吗？如果是这样，我们鼓励你浏览我们团队的 open roles。

致谢

最后，我们需要特别感谢 Airfam 和校友 Sam Barrows、Robert Chang、Linsha Chen、Richard Dear、Andrey Fradkin、Ruben Lobel、Brian De Luna、Dan T. Nguyen、Vaughn Quoss、Jason Ting 和 Peng Ye。没有他们的基础工作，这些 LTV 模型是不可能实现的。

还要感谢 Rebecca Ajuonuma、Carolina Barcenas、Nathan Brixius、Jenny Chen、Peter Coles、Lauren Mackevich、Dan Schmierer、Yvonne Wang、Shanni Weilert 和 Jane Zhang 在撰写这篇博文时提供的宝贵反馈。