Content-Length: 123471 | pFad | https://www.clouderacn.cn/products/data-hub.html

CDP Data Hub: 基于云的分析服务| Cloudera

Cloudera 最新研究: 企业 AI 和现代数据架构现状

阅读报告
概览

可快速又便捷地在公有云中部署各种分析。

CDP Data Hub 是 Cloudera Data Platform(CDP)公有云平台上的一项功能强大的分析服务,可以更便捷、更快速地在云端熟悉的集群模型中实现从边缘到人工智能的高价值分析。CDP Data Hub 具有包括流、ETL、数据集市、数据库和机器学习在内的最广泛的分析工作负载,能够让您轻松地将现有工作负载从本地部署环境迁移到云端或直接在云端构建。

该综合性的基于云计算的解决方案由 Cloudera Runtime 提供支持,Cloudera Runtime 是基于 SDX 构建的一整套开源技术的集成。它提供了集群形态、工作负载类型、预建模板和配置选项等多种选择,为熟悉传统体系架构的用户提供非常直观且定制化的体验。

Data Hub 用例

简化您的云之旅

由于利用了该跨公有云和私有云的平台,可以轻松地将本地 Cloudera 工作负载提升转移到公有云,并具备以下特性:

  • 改进的性能、强大的治理和公有云的可用性
  • 可以在两种部署模型中优化工作负载的灵活性
  • 与传统集群模型比较相近的形式有助于您迁移到云端 
  • 具备通往 CDP 容器化体验的无缝迁移路径 
快速部署复杂的多分析工作负载

可以加速跨数据生命周期的公有云中复杂工作负载的部署: 

  • 凭借基于云计算的体系架构,可让您部署各种灵活的自定义分析工作负载 
  • 无论是选择模板化方法还是构建您自身的工作负载,都可以使用熟悉的基于节点的集群来获得直观的体验
  • 具备高度定制化功能,可让您部署满足特定业务需求的量身定制的工作负载

选择工作负载

  • 实时数据集市
  • 面向复杂管道的数据工程
  • 混合云上的流式传输
  • 操作型数据库

实时数据集市


可对海量快速到达的数据进行分析。 

使用 Data Hub 中的Real Time Data Mart 实时数据集市模板,可以每秒摄取数百万条记录,并且可以根据需要进行就地更新。数据能够以最佳格式立即可供查询。此模式非常适合时序应用程序、事件分析、CDC 调谐和实时数据处理管道。该模板配有 Apache Kudu 分析存储引擎,用于快速 SQL 执行的 Apache Impala,SQL 开发和分析的 HUE,以及用于流处理/分析的 Apache Spark Streaming。

 

面向复杂管道的数据工程


丰富、转换和加载数据。 

通过 Data Hub,您可以增强、转换和清洗数据,从而以高度的灵活性和定制性来创建、执行和管理端到端数据管道。Data Engineering模板可助您执行广泛的数据处理工作负载,包括使用 Apache Spark 和 Hive 进行批处理和实时流处理。

混合云上的流式传输



收集、处理和构建实时分析

DataFlow for CDP Data Hub 是一款综合性的边缘到云端流数据平台,借助 Apache NiFi 和 Kafka 来应对混合环境中的一些流数据挑战。用户可以将Cloudera DataFlow的本地部署流体验扩展到云端,而无需耗费大量的资源来开发、配置和维护它们。

了解有关 DataFlow 云服务的更多信息

操作型数据库


构建高度可靠的企业级应用程序。 

Data Hub 可以让您运行支持ANSI SQL 的高性能 NoSQL 数据库。这对使用 Apache Hbase 的业务关键型操作应用程序提供了无与伦比的规模和性能。Operational Database支持演进式模式,使开发人员能够在充分利用数据的功能的同时保留应用程序设计的灵活性。它还可以根据集群的工作负载利用率提供自动扩展功能,从而优化基础架构利用率和成本。

特征

Data Hub 适用于需要综合考量灵活性、可扩展性和易用性的用户。它可以允许您重新安排工作人员角色,配置 GPU 支持,调整资源管理设置以及调优集群,从而大规模实施复杂的多功能分析用例。

可使用基础架构预构建或自定义的配置选项快速配置和处置 Data Hub 集群。通过特定于云服务提供商设置的预配置集群定义和具有 Cloudera Runtime 服务配置的集群模板,可以快速为规范性用例配置工作负载集群。还可以保存自己的集群定义和模板,以备将来重用。

Data Hub可以轻松地以相近的形态将传统工作负载迁移到云模式中。这种基于云计算的体系架构可以将数据与计算基础设施分离,并且数据交付层从原始数据中抽象出来。这种分离式的体系架构显著提高了灵活性、敏捷性、数据保护和扩展性。

由于在共享数据上配置多个集群是比较容易的,因此客户可以启用新的应用程序,可以通过适当的安全与治理完全隔离这些应用程序,而不会中断现有的生产应用程序。

Data Hub 由 Cloudera SDX 提供支撑,可以通过专用的集成界面来管理、保护和治理平台数据和元数据以及控制功能。数据安全、治理和控制策略仅设置一次就能持续地执行,从而可以降低运营成本和业务风险,同时实现完整的基础架构选择性和灵活性。

Cloudera Runtime 是 CDP 中的核心开源软件发行版,包括大约 50 个开源项目。Data Hub 内置在 Cloudera Runtime 中。通过 Runtime,您可以采取适宜的开源工具集来构建工作负载和应用程序。

愿意进行更深入的了解吗?


亲身体验 Cloudera Data Platform 上的 Data Hub

Datasheet

CloudSmart:开始您的云分析之旅

Webinar

在公有云中充满信心地扩展分析

Ebook

成功迁移到公有云的三个步骤

Solution Brief

利用 Cloudera 和 IQVIA 促进更好的健康结果

世界级的训练,技术支持和服务

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.








ApplySandwichStrip

pFad - (p)hone/(F)rame/(a)nonymizer/(d)eclutterfier!      Saves Data!


--- a PPN by Garber Painting Akron. With Image Size Reduction included!

Fetched URL: https://www.clouderacn.cn/products/data-hub.html

Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy