Descripción
Implemente una amplia variedad de análisis en la nube pública de forma rápida y sencilla.
Cloudera Data Hub es un potente servicio de análisis para Cloudera en la nube que facilita y acelera la obtención de análisis de alto valor, desde Edge to AI hasta la IA, en un modelo de clúster conocido en la nube. Con la más amplia gama de cargas de trabajo analíticas (para transmisión, ETL, data marts, bases de datos y aprendizaje automático, entre otros), Data Hub le permite trasladar con facilidad sus cargas de trabajo existentes del entorno local a la nube, o bien crear nuevas cargas de trabajo directamente en la nube.
Esta solución integral basada en la nube cuenta con Cloudera Runtime, un conjunto de tecnologías integradas de código abierto, y se basa en SDX. Además, ofrece una amplia variedad de formas de clúster, tipos de cargas de trabajo, plantillas prediseñadas y opciones de configuración, lo que proporciona una experiencia intuitiva y personalizable para los usuarios acostumbrados a las arquitecturas tradicionales.
Casos de uso de Data Hub
Simplifique su migración a la nube
Realoje fácilmente las cargas de trabajo locales de Cloudera en la nube pública gracias a una plataforma que abarca tanto nubes públicas como privadas y que, además, le proporciona:
- El rendimiento mejorado, el gobierno sólido y la disponibilidad propios de la nube pública
- Flexibilidad para optimizar sus cargas de trabajo en ambos modelos de implementación
- Las ventajas de un factor de forma conocido con un modelo de clúster tradicional que facilita su migración a la nube
- Una ruta de migración fluida a las experiencias en contenedores de Cloudera
Implemente cargas de trabajo complejas con varios análisis de forma rápida
Agilice la implementación de cargas de trabajo complejas en la nube pública en todo el ciclo de vida de los datos gracias a lo siguiente:
- Una arquitectura basada en la nube que le permite implementar una amplia variedad de cargas de trabajo de análisis flexibles y personalizadas
- Una experiencia intuitiva mediante clústeres basados en nodos con los que está familiarizado, independientemente de si usa plantillas prediseñadas o crea sus propias cargas de trabajo
- Un alto grado de personalización, el cual le permite implementar cargas de trabajo adaptadas a sus necesidades empresariales específicas
Selección de cargas de trabajo
- Data marts en tiempo real
- Ingeniería de datos para canalizaciones complejas
- Transmisión en la nube híbrida
- Base de datos operacional
Data marts en tiempo real
Permita el análisis de grandes volúmenes de datos que cambian rápidamente.
La plantilla de data marts en tiempo real de Data Hub le permite ingerir millones de registros por segundo, con actualizaciones puntuales según sea necesario. Los datos están disponibles al instante en un formato óptimo para realizar consultas. Este modelo es ideal para aplicaciones de series temporales, análisis de eventos, conciliación de datos modificados y canalizaciones de procesamiento de datos en tiempo real. La plantilla cuenta con el motor de almacenamiento analítico Apache Kudu, Apache Impala para una ejecución rápida de SQL, HUE para el desarrollo y análisis de SQL, y Apache Spark Streaming para el procesamiento y análisis de flujos de datos.
Ingeniería de datos para canalizaciones complejas
Enriquezca, transforme y cargue sus datos.
Data Hub le permite enriquecer, transformar y, también, limpiar los datos para crear, ejecutar y gestionar canalizaciones de datos de extremo a extremo con un alto nivel de flexibilidad y personalización. Con la plantilla de ingeniería de datos, Data Engineering, puede ejecutar una amplia variedad de cargas de trabajo de tratamiento de datos, incluido el procesamiento de flujos de datos en tiempo real y por lotes mediante Apache Spark y Hive.
Transmisión en la nube híbrida
Recopile, procese y genere análisis en tiempo real.
DataFlow para Data Hub es una completa plataforma de datos en transmisión de edge a nube que aborda algunos de los retos de los datos en transmisión en entornos híbridos con Apache NiFi y Kafka. Permite a los usuarios extender la misma experiencia de transmisión local de Cloudera DataFlow a la nube sin requerir gran cantidad de recursos para el desarrollo, la configuración y el mantenimiento.
Base de datos operativa
Cree aplicaciones de nivel empresarial altamente fiables.
Data Hub le permite ejecutar bases de datos de NoSQL de alto rendimiento compatibles con ANSI SQL. Esto proporciona una escala y un rendimiento incomparables para las aplicaciones operativas cruciales para la empresa con Apache Hbase. La base de datos operacional admite un esquema evolutivo que permite a los desarrolladores aprovechar los datos al máximo y, a su vez, mantener la flexibilidad en el diseño de las aplicaciones. También ofrece funciones de escalado automático en función del uso de cargas de trabajo del clúster para optimizar la utilización y los costes de la infraestructura.