Análisis detallado de la próxima fase de Hybrid Data Lakehouse de Cloudera

La Inteligencia Artificial (IA) está lista para transformar la forma en que operan la mayoría de las empresas. Según la investigación de Cloudera, más de un tercio (36%) de las organizaciones en los EE. UU. están explorando el potencial de implementación de la IA en sus primeras etapas. A pesar de su crecimiento, la IA sigue siendo un desafío para algunas empresas. La calidad de la IA, al igual que cualquier tipo de análisis, depende de la calidad de los datos en los que se basa. Aquí es donde surge el problema. Debido a las dificultades para acceder y recopilar datos dispersos y aislados en los entornos adecuados para impulsar la IA, muchas organizaciones no logran alcanzar la visión empresarial y el valor esperado. Ante desafíos específicos relacionados con infraestructuras de datos distribuidas, gobernanza y un entorno de seguridad en constante evolución, las empresas requieren el soporte adecuado para aprovechar al máximo y de forma rápida la IA.

Para satisfacer las necesidades de datos, inteligencia artificial y análisis de nuestros clientes, presentamos la siguiente fase de nuestro Data Lakehouse abierta, que incluye diversas mejoras diseñadas para escalar rápidamente la IA empresarial y brindar un valor comercial excepcional. Cloudera ahora es el único proveedor que ofrece un Data Lakehouse abierto con Apache Iceberg tanto en la nube como en instalaciones locales. Conforme a IDC, aproximadamente la mitad de los datos empresariales en producción a nivel mundial se gestionan localmente en la actualidad. La última versión de la plataforma Cloudera presenta un conjunto único de capacidades para extender la funcionalidad del Data Lakehouse desde la nube a esos centros de datos. La plataforma está lista para abordar las complejidades de gestionar datos empresariales altamente confidenciales pero cruciales y a la vez extraer el máximo valor de su uso.

Veamos más de cerca tres de las funciones más impactantes incluidas en esta actualización.

Apache Iceberg

La inclusión del soporte de Apache Iceberg en la plataforma Cloudera abre nuevas oportunidades para que las empresas apliquen datos críticos a la IA, aborden procesos propensos a errores y generen nuevos casos de uso, mejorando el rendimiento general y reduciendo costos. Iceberg proporciona un formato de tabla abierto que permite a las empresas poner la IA a trabajar en sus datos, todo en un entorno local. Esta aproximación incorpora nuevos motores de procesamiento, como Spark, Flink, Impala y NiFi, facilitando el acceso y procesamiento concurrente de conjuntos de datos dentro de Iceberg.

Con funcionalidades integradas como control de versiones, evolución de esquemas y descubrimiento de datos optimizado, Iceberg capacita a los equipos de datos para mejorar la gestión del Data Lakehouse y garantizar la integridad de los datos. Aspectos como la evolución de esquemas en el sitio y transacciones ACID en el Data Lakehouse son elementos críticos para las organizaciones que buscan cumplir con regulaciones y políticas como el GDPR. La capa robusta de gobernanza y seguridad de datos proporcionada por la plataforma, Shared Data Experience (SDX), es una parte integral del Data Lakehouse abierto, tanto en el centro de datos como en la nube.

Apache Ozone

A medida que la IA y otros análisis avanzados continúen aumentando en escala, el rendimiento y la escalabilidad del almacenamiento de datos también deberán expandirse. Específicamente para los centros de datos, Apache Ozone ofrece mayor escalabilidad a un menor costo, ayudando a las organizaciones a crear más valor comercial. Con las nuevas funciones presentes en la última actualización de la plataforma Cloudera, los clientes tienen las herramientas necesarias para fortalecer la seguridad y preparación empresarial. La generación más reciente de nuestra plataforma incluye características de Ozone como replicación mejorada, cuotas mejoradas para volúmenes, depósitos que simplifican las arquitecturas nativas de la nube y snapshots, que ahora pueden admitir almacenamiento de datos a nivel de depósito y volumen.

Actualizaciones sin interrupciones

Más allá de las mejoras en Iceberg y Ozone, la plataforma ahora cuenta con Actualizaciones sin Tiempo de Inactividad (ZDU). ZDU ofrece a las organizaciones una forma más conveniente de realizar actualizaciones. Las actualizaciones continuas ahora son compatibles con HDFS, Hive, HBase, Kudu, Kafka, Ranger, YARN y Ranger KMS. ZDU asegura que los clientes experimenten mínimas interrupciones en sus flujos de trabajo, reduciendo o eliminando costosos tiempos de inactividad.

Al incorporar ZDU, los clientes obtienen un impulso significativo en su productividad con características como actualizaciones en un solo paso y actualizaciones automáticas de grandes clústeres. Para los componentes de la plataforma que todavía requieren tiempo de inactividad, esta actualización garantiza una optimización a través de Cloudera Manager para un reinicio rápido. Esto representa una mejora clave con respecto a versiones anteriores, donde algunos servicios, como el Administrador de Colas, solían ser los primeros en dejar de funcionar y los últimos en reiniciarse. Ahora, estos servicios pueden restaurarse en cuestión de minutos, justo al inicio de la ZDU.

La IA sigue consolidándose como un elemento central en la generación de valor empresarial a partir de los datos corporativos. Sin embargo, alcanzar este valor implica utilizar datos y análisis en el entorno adecuado para su ejecución; esta es la importancia de un enfoque híbrido. Y es precisamente lo que hace a Cloudera único. La plataforma Cloudera ofrece análisis portátiles y nativos de la nube que se pueden implementar en diferentes infraestructuras, manteniendo una gobernanza y seguridad de datos uniformes. Disponible tanto en la nube como en centros de datos.

Aprende más sobre la próxima generación de Cloudera Data Platform para Private Cloud.

¿Nos apoyarás hoy?

Creemos que todos merecen entender el mundo en el que viven. Este conocimiento ayuda a crear mejores ciudadanos, vecinos, amigos y custodios de nuestro planeta. Producir periodismo explicativo y profundamente investigado requiere recursos. Puedes apoyar esta misión haciendo una donación económica a Gelipsis hoy. ¿Te sumarás a nosotros?

Suscríbete para recibir nuestro boletín:

Recent Articles

Related Stories

DEJA UN COMENTARIO

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí