Los esquemas multidimensionales están diseñados para construir un modelo de sistemas de almacén de datos.

El objetivo principal de estos esquemas es atender las necesidades de bases de datos más grandes construidas con fines analíticos (OLAP).

Este método se utiliza para ordenar los datos en la base de datos con una buena disposición de los contenidos en una base de datos. El esquema permite a los clientes formular preguntas asociadas a las tendencias del negocio o del mercado.

Además, un esquema multidimensional representa los datos en forma de cubos de datos que permiten ver y modelar los datos desde diferentes perspectivas y dimensiones.

Es de tres tipos, pero muchos confunden entre estrella y copo de nieve. De ahí que les resulte difícil elegir el modelo preferible.

Si usted es uno de ellos, hablemos de las diferencias entre el esquema de estrella y el de copo de nieve, empezando por la definición y comprendiendo sus ventajas, retos, diagrama y características.

¿Qué es un esquema multidimensional?

El esquema se refiere a la descripción lógica de una base de datos completa y de los mercados de datos. Incluye el nombre de los registros y sus descripciones, incluidos los agregados y los elementos de datos asociados.

Una base de datos utiliza generalmente un modelo relacional para describir, mientras que un sistema de almacén de datos utiliza un modelo de esquema.

Los esquemas multidimensionales pueden definirse con el lenguaje de consulta de minería de datos (DMQL).

Para definir los marts de datos y los almacenes de datos, utiliza dos primitivas: la definición de dimensiones y la definición de cubos.

El esquema multidimensional utiliza diferentes tipos de modelos de esquema. Estos son

  • Esquema en estrella
  • Esquema de copo de nieve
  • Esquema Galaxy

Analicemos qué son los esquemas estrella y copo de nieve.

Estrella vs. Copo de nieve: ¿Qué son?

¿Qué es el esquema en estrella?

Un esquema en estrella es un modelo arquitectónico de almacenamiento de datos e inteligencia empresarial que requiere una única tabla de hechos para almacenar los datos medidos y transaccionales. También utiliza diferentes tablas dimensionales más pequeñas para contener atributos sobre los datos empresariales.

Recibe su nombre en función de su estructura. Como en una estrella, la tabla de hechos ocupa su lugar en el centro del esquema, y las tablas dimensionales pequeñas se sitúan como ramas de la tabla central para formar una estructura en estrella.

Todo esquema en estrella consta de una única tabla de hechos pero de múltiples tablas dimensionales pequeñas. Las tablas de hechos incluyen datos específicos y medibles que deben analizarse, como el rendimiento registrado, los datos financieros o los registros de ventas. Puede tratarse de una instantánea de datos históricos a la vez o transaccionales.

Además, el esquema Star es el más sencillo y fundamental entre los esquemas de almacenes de datos y data mart. Es eficiente en el manejo de consultas básicas. Por lo general, el esquema Star admite la inteligencia empresarial, las consultas ad hoc, la aplicación analítica y los cubos de procesamiento analítico en línea.

El esquema en estrella también admite el recuento, la media, la suma y otras agregaciones de muchos registros. Los usuarios pueden filtrar y agrupar fácilmente las agregaciones por dimensiones. Por ejemplo, los usuarios generan consultas como «encontrar todos los registros de ventas en junio» o «analizar los ingresos totales de la oficina XYZ en 2022».

¿Qué es el esquema de copo de nieve?

Un esquema de copo de nieve es un modelo de datos multidimensional que también puede conocerse como la extensión del esquema de estrella. Esto se debe a que las tablas de dimensiones del esquema de copo de nieve se descomponen en subdimensiones.

Un esquema es un copo de nieve si una o varias tablas de dimensiones no se enlazan directamente con la tabla de hechos, sino que se conectan a través de otras tablas de dimensiones.

El copo de nieve es un fenómeno que normaliza las tablas de dimensión en un esquema estrella. Cuando se normalizan todas las tablas de dimensión, la estructura resultante se asemeja a un copo de nieve que contiene una tabla de hechos en el centro de la estructura.

En palabras sencillas, el esquema de copo de nieve consiste en una tabla de hechos en el centro del modelo, que está conectada a tablas de dimensiones, que a su vez están conectadas a otras tablas de dimensiones. Este esquema se utiliza para mejorar el rendimiento de las consultas.

El modelo se crea para realizar consultas rápidas y flexibles a través de relaciones y dimensiones complejas. Es útil para las relaciones uno a muchos y muchos a muchos entre varios niveles de dimensiones.

Debido a la mayor adherencia a más normas de normalización, obtendrá una mayor eficiencia de almacenamiento. Sin embargo, la redundancia de datos es insignificante y el rendimiento es bajo en comparación con los modelos de datos desnormalizados como el esquema en estrella.

Estrella vs. Copo de nieve: ¿Cómo funcionan?

¿Cómo funciona un esquema en estrella?

La tabla de hechos situada en el centro del modelo en estrella almacena dos tipos de información: valores numéricos y de atributos de dimensión. Entendámoslos con un ejemplo de una base de datos de ventas.

  • Los valoresnuméricos son únicos para cada fila y punto de datos. No se correlacionan ni se relacionan con los datos almacenados en otra fila. Son datos sobre una transacción determinada, como el importe total, la cantidad del pedido, la hora exacta, el beneficio neto, el ID del pedido, etc.
  • Losvalores de los atributos dimensionales no almacenan ningún dato directamente, sino que almacenan valores de clave externa para la fila de una tabla dimensional. Diferentes filas de la tabla central harán referencia a esta información, como el valor de los datos, el ID del empleado de ventas, el ID de la sucursal, el ID del producto, etc.

Las tablas de dimensiones siempre almacenan información de apoyo de la tabla de hechos. Cada tabla dimensional hace referencia a la columna de una tabla de hechos junto con un valor dimensional y almacena datos adicionales sobre ese valor.

Ejemplo: La tabla de dimensiones de empleados utiliza el ID de empleado como valor clave y también contiene información como el nombre, el sexo, la dirección y el número de teléfono. Del mismo modo, una tabla de dimensiones de productos almacena información, como el nombre del producto, el color, la primera fecha de salida al mercado, el coste de fabricación, etc.

¿Cómo funciona un esquema de copo de nieve?

Piense en el diseño de un copo de nieve con una caja central y diferentes conexiones a través de esa caja a diferentes puntos. Para mantener los data marts y los almacenes de datos, entra en escena el diseño de esquema de copo de nieve.

Es similar al esquema en estrella pero con pequeños cambios. A diferencia del esquema en estrella, el esquema en copo de nieve amplía sus tablas de subdimensiones, que están vinculadas a tablas de dimensiones.

El objetivo principal de este modelo es normalizar la información desnormalizada del modelo en estrella. De este modo, puede resolver problemas comunes asociados a un esquema en estrella.

En el núcleo del esquema, encontrará una tabla de hechos que enlaza con la información contenida en las tablas de dimensiones. Estas tablas vuelven a irradiar hacia el exterior a las tablas de subdimensión que tienen información detallada que describe la información de la tabla de dimensión.

Ejemplo: El esquema copo de nieve contiene una tabla de hechos de ventas y tablas de dimensiones de ubicación de la tienda, línea, familia, producto y tiempo. Las dimensiones de mercado constan de dos tablas de dimensión, con la tienda como tabla de dimensión primaria y la ubicación de la tienda como tabla de subdimensión. La dimensión producto tiene tres tablas de subdimensión que mencionan una tabla de subdimensión producto, línea y familia.

Estrella frente a copo de nieve: Características

Características del esquema Star

  • El esquema en estrella puede filtrar datos a partir de datos normalizados para satisfacer las necesidades del almacenamiento de datos. La clave única se genera a partir de la información asociada a cada tabla de hechos para identificar cada fila.
  • Proporciona cálculos y agregaciones rápidos, como los ingresos obtenidos y el total de artículos vendidos al final de cada mes. Estos detalles pueden filtrarse en función de las necesidades mediante la formulación de consultas adecuadas.
  • Es la medición de eventos que incluye valores numéricos finitos consistentes en la clave foránea. Estas claves están relacionadas con las tablas dimensionales. Existen varios tipos de tablas de hechos que se enmarcan con valores a nivel atómico.
  • La tabla de hechos de transacción contiene datos sobre hechos concretos, como ventas y vacaciones.
  • Los hechos de registro incluyen periodos determinados, como la información de cuentas al final del año o cada trimestre.
  • La tabla dimensional ofrece datos detallados sobre atributos o registros que se encuentran en la tabla central.
  • El usuario es capaz de diseñar por sí mismo una tabla según sus necesidades.
  • Puede utilizar el esquema en estrella para acumular tablas instantáneas.

Características del esquema de copo de nieve

  • El esquema copo de nieve necesita poco espacio en disco.
  • Este modelo es fácil de implementar gracias a sus tablas de dimensiones separadas y principales.
  • Las tablas de dimensiones contienen al menos dos atributos para definir la información en varios granos.
  • Debido a las múltiples tablas, el rendimiento es bajo en comparación con el esquema en estrella.
  • El esquema de copo de nieve tiene el mayor nivel de integridad de datos y bajas redundancias debido a la normalización.

Estrella frente a copo de nieve: Ventajas

Ventajas del esquema en estrella

  • El esquema en estrella es el más sencillo entre los esquemas de data mart.
  • Tiene una lógica de información simple. Esta lógica se implica dinámicamente.
  • Está diseñado utilizando cubos de alimentación aplicados a través del Proceso de transacción en línea para que los cubos funcionen de forma eficiente y eficaz.
  • El esquema en estrella se forma con una lógica simple y consultas fáciles de extraer del proceso transaccional.
  • Ofrece un rendimiento mejorado para las aplicaciones de generación de informes.
  • Se despliega para controlar la rápida recuperación de datos.
  • La información filtrada y seleccionada puede aplicarse fácilmente en diferentes casos.

Ventajas del esquema Snowflake

  • El esquema en estrella se utiliza para desarrollar el rendimiento de las consultas gracias a la menor necesidad de almacenamiento en disco.
  • Ofrece una mayor escalabilidad en las relaciones entre componentes y niveles de dimensión.
  • Es más fácil de mantener.
  • El esquema en estrella ofrece una rápida recuperación de los datos.
  • Es un esquema de datos común y sencillo para el almacenamiento de datos.
  • Ayuda a mejorar la calidad de los datos.
  • Los datos estructurados reducen el problema de la integridad de los datos.

Estrella frente a copo de nieve: Limitaciones

Limitaciones del esquema Star

Tiene un elevado estado de desnormalización e integridad. Todo el proceso se colapsará si el usuario no actualiza los datos. La seguridad y las protecciones también son limitadas. Además, el esquema en estrella no es tan flexible como el modelo analítico. No ofrece un soporte eficaz a diversas relaciones.

Limitaciones del esquema Snowflake

La principal limitación que encontrará en Snowflake es el esfuerzo adicional de mantenimiento debido al creciente número de tablas de dimensiones reducidas. Muchas consultas complejas dificultan la búsqueda de los datos necesarios. Además, el tiempo de implementación de la consulta es elevado debido al mayor número de tablas. Este modelo también es rígido y requiere mayores costes de mantenimiento.

Estrella frente a copo de nieve: Diferencias

La estrella y el copo de nieve son tipos de esquema multidimensional, pero tienen estructuras y propiedades diferentes. El primero es como una estrella y el segundo se parece a un copo de nieve, lo que define sus nombres.

En el esquema de estrella, sólo una única unión construye una relación entre la tabla de hechos central y las tablas de dimensiones laterales. En cambio, en el esquema de copo de nieve, se necesitan múltiples uniones para relacionar las tablas de dimensiones.

El esquema de estrella se utiliza generalmente cuando se tiene un número menor de filas en la tabla de dimensión, mientras que el esquema de copo de nieve se utiliza cuando una tabla de dimensión es relativamente grande.

El diagrama siguiente diferencia los dos modelos y cómo se enlazan las tablas de dimensiones y la tabla de hechos en esquemas diferentes.

ParámetrosEsquema estrellaEsquema copo de nieve
Espacio en discoEl esquema Star utiliza más espacio en disco.El esquema Snowflake utiliza menos espacio en disco.
Redundancia de datosTiene alta redundancia de datos.Tiene baja redundancia de datos.
NormalizaciónLas tablas de dimensiones están desnormalizadas, lo que significa que se repite el mismo valor dentro de la tabla.Las tablas de dimensiones están totalmente normalizadas.
Rendimiento de las consultasTarda un tiempo mínimo en ejecutar las consultas, lo que se traduce en un mejor rendimiento.Tarda más tiempo que el esquema en estrella en la ejecución de las consultas, por lo que su rendimiento es menor que el del esquema en estrella.
Complejidad de las consultasLa complejidad de la consulta es baja.La complejidad de las consultas es mayor que la del esquema en estrella.
MantenimientoDebido a la alta redundancia de datos, el mantenimiento del esquema en estrella es un poco difícil.Debido a la baja redundancia de datos, es fácil mantener y cambiar el esquema de copo de nieve.
Integridad de los datosLa integridad de los datos es alta porque los datos se almacenan de forma redundante y existen varias copias en las tablas de dimensiones.La integridad de los datos es baja ya que normaliza completamente las tablas de dimensiones.
Jerarquías Las jerarquías de las tablas de dimensiones en el esquema estrella se almacenan en la tabla de dimensiones.Las jerarquías se dividen en tablas de dimensiones separadas.
Diseño de la BDTiene un diseño de BD sencillo.Tiene un diseño de BD muy complejo.
Tabla de hechosVarias tablas de dimensiones rodean a una tabla de hechos.La tabla de hechos está rodeada por tablas de dimensiones que a su vez están rodeadas por tablas de subdimensiones.
EsquemaEl esquema en estrella es fácil de diseñar y configurar, ya que lo representan relaciones directas.En cambio, el esquema de copo de nieve es un poco complejo de configurar.
Procesamiento de cubosEl procesamiento de cubos es más rápido.Debido a las uniones complejas, el procesamiento de cubos es un poco lento.
Claves foráneasTiene un número mínimo de claves foráneas.Tiene el número máximo de claves foráneas.

Conclusión

Tanto el esquema Star como el Snowflake son útiles en diferentes sectores. Por lo tanto, decidir cuál es mejor entre ellos se basa en sus requisitos.

El esquema de copo de nieve es la extensión del esquema de estrella, donde normaliza las tablas de dimensiones en el esquema de estrella.

El esquema en estrella es sencillo en su diseño, ejecuta las consultas más rápidamente y su configuración es fácil. Por otro lado, el esquema de copo de nieve es más fácil de mantener, ocupa menos espacio en disco y es menos propenso a los problemas de integridad de los datos.

Así pues, un esquema en estrella podría ser la mejor opción si necesita un diseño sencillo, menos claves foráneas y un procesamiento de cubos más rápido. Pero, si necesita menos espacio en disco, poca integridad de los datos y poco mantenimiento, el esquema de copo de nieve puede ser más adecuado.

También puede explorar algunas de las mejores soluciones de bases de datos gráficas.