概览
可快速又便捷地在公有云中部署各种分析。
CDP Data Hub 是 Cloudera Data Platform(CDP)公有云平台上的一项功能强大的分析服务,可以更便捷、更快速地在云端熟悉的集群模型中实现从边缘到人工智能的高价值分析。CDP Data Hub 具有包括流、ETL、数据集市、数据库和机器学习在内的最广泛的分析工作负载,能够让您轻松地将现有工作负载从本地部署环境迁移到云端或直接在云端构建。
该综合性的基于云计算的解决方案由 Cloudera Runtime 提供支持,Cloudera Runtime 是基于 SDX 构建的一整套开源技术的集成。它提供了集群形态、工作负载类型、预建模板和配置选项等多种选择,为熟悉传统体系架构的用户提供非常直观且定制化的体验。
Data Hub 用例
简化您的云之旅
由于利用了该跨公有云和私有云的平台,可以轻松地将本地 Cloudera 工作负载提升转移到公有云,并具备以下特性:
- 改进的性能、强大的治理和公有云的可用性
- 可以在两种部署模型中优化工作负载的灵活性
- 与传统集群模型比较相近的形式有助于您迁移到云端
- 具备通往 CDP 容器化体验的无缝迁移路径
快速部署复杂的多分析工作负载
可以加速跨数据生命周期的公有云中复杂工作负载的部署:
- 凭借基于云计算的体系架构,可让您部署各种灵活的自定义分析工作负载
- 无论是选择模板化方法还是构建您自身的工作负载,都可以使用熟悉的基于节点的集群来获得直观的体验
- 具备高度定制化功能,可让您部署满足特定业务需求的量身定制的工作负载
选择工作负载
- 实时数据集市
- 面向复杂管道的数据工程
- 混合云上的流式传输
- 操作型数据库
面向复杂管道的数据工程
丰富、转换和加载数据。
通过 Data Hub,您可以增强、转换和清洗数据,从而以高度的灵活性和定制性来创建、执行和管理端到端数据管道。Data Engineering模板可助您执行广泛的数据处理工作负载,包括使用 Apache Spark 和 Hive 进行批处理和实时流处理。
混合云上的流式传输
收集、处理和构建实时分析
DataFlow for CDP Data Hub 是一款综合性的边缘到云端流数据平台,借助 Apache NiFi 和 Kafka 来应对混合环境中的一些流数据挑战。用户可以将Cloudera DataFlow的本地部署流体验扩展到云端,而无需耗费大量的资源来开发、配置和维护它们。
操作型数据库
构建高度可靠的企业级应用程序。
Data Hub 可以让您运行支持ANSI SQL 的高性能 NoSQL 数据库。这对使用 Apache Hbase 的业务关键型操作应用程序提供了无与伦比的规模和性能。Operational Database支持演进式模式,使开发人员能够在充分利用数据的功能的同时保留应用程序设计的灵活性。它还可以根据集群的工作负载利用率提供自动扩展功能,从而优化基础架构利用率和成本。