可组合架构在整个软件行业越来越受欢迎。我们个人一直在开创可组合客户数据平台 (CDP),该平台将之前捆绑的 CDP 功能解耦,并允许公司围绕自己的数据基础设施选择最佳工具。同样,Lakehouse 允许公司围绕自己的存储选择最佳查询引擎。
与任何颠覆性技术一样,Lakehouse 只有向企业展示足够的价值,才能吸引企业采用。以下是促使企业做出改变的一些原因:
拥有自己的 IG数据库 数据。使用 Iceberg 格式的对象存储,您可以在自己的私有云网络中完全拥有数据。这可以立即降低安全风险(因为您的数据不再存在于另一个 SaaS 工具的基础设施中),并且您可以避免被锁定在某些专有存储格式中(与其他查询引擎不兼容)。
为每个任务选择最佳查询引擎。根据定义,每个查询引擎执行任务的方式都不同。有些引擎在不同的项目中比其他引擎更好——这就是为什么您经常会看到企业针对不同的用例同时使用Snowflake 和 Databricks。探索性分析、商业智能 (BI)、数据转换、机器学习和 AI 的需求都截然不同。公司不必使用与数据仓库相关联的单个查询引擎来执行所有这些任务,而是可以轻松地换用针对每个任务优化的不同引擎。
降低成本。上面讨论的所有好处也与成本有关。为每项任务选择最高效的查询引擎将使公司节省总计算成本,并在竞争性查询引擎之间协商以获得更优惠的价格。如果公司选择将数据存储在自己的环境中,而不是为托管仓库中的存储支付额外费用,他们还可以节省资金。