ESTRUCTURA DEL DATA WAREHOUSE
Los data warehouses tienen una estructura distinta. Hay niveles diferentes de esquematización y detalle que
delimitan el data warehouse. La estructura de un data warehouse se muestra en
la Figura N° 5.
En
la figura, se muestran los diferentes componentes del
data warehouse y son:
- Detalle de datos actuales
- Detalle de datos antiguos
- Datos ligeramente resumidos
- Datos completamente resumidos
- Meta data
- Detalle de datos actuales.- En gran parte, el interés más importante radica en el
detalle de los datos actuales, debido a que:
- Refleja las ocurrencias más
recientes, las cuales son de gran interés
- Es voluminoso, ya que se
almacena al más bajo nivel de granularidad.
- Casi siempre se almacena en
disco, el cual es de fácil acceso, aunque su administración sea costosa y
compleja.
- Detalle de datos antiguos.- La data antigua es aquella que se almacena sobre
alguna forma de almacenamiento masivo. No es frecuentemente accesada y se
almacena a un nivel de detalle, consistente con los datos detallados
actuales. Mientras no sea prioritario el almacenamiento en un medio de
almacenaje alterno, a causa del gran volumen de
datos unido al acceso no frecuente de los mismos, es poco usual utilizar
el disco como medio de almacenamiento.
- Datos ligeramente resumidos.- La data ligeramente resumida es aquella que proviene
desde un bajo nivel de detalle encontrado al nivel de detalle actual.
Este nivel del data warehouse casi siempre se
almacena en disco. Los puntos en los que se basa el diseñador para
construirlo son:
- Que la unidad de tiempo se
encuentre sobre la esquematización hecha.
- Qué contenidos (atributos)
tendrá la data ligeramente resumida.
- Datos completamente resumidos.- El siguiente nivel de datos encontrado en el data
warehouse es el de los datos completamente resumidos. Estos datos son
compactos y fácilmente accesibles.

A veces se
encuentra en el ambiente de data warehouse y en otros, fuera del
límite de la tecnología que ampara al data warehouse. (De todos
modos, los datos completamente resumidos son parte del data warehouse sin
considerar donde se alojan los datos físicamente.)
- Metadata.- El componente final del data
warehouse es el de la metadata. De muchas maneras la metadata se sitúa en
una dimensión diferente al de otros datos del
data warehouse, debido a que su contenido no es tomado directamente desde
el ambiente operacional.
La
metadata juega un rol especial y muy importante en el data warehouse y es usada
como:
- Un directorio para ayudar al
analista a ubicar los contenidos del data
warehouse.
- Una guía para el mapping de
datos de cómo se transforma, del ambiente
operacional al de data warehouse.
- Una guía de los algoritmos
usados para la esquematización entre el detalle de datos actual, con los
datos ligeramente resumidos y éstos, con los datos completamente
resumidos, etc.
La
metadata juega un papel mucho más importante en un ambiente data warehousing
que en un operacional clásico.
A
fin de recordar los diferentes niveles de los datos
encontrados en el data warehouse, considere el ejemplo mostrado en la Figura N°
6.
El
detalle de ventas antiguas son las que se encuentran antes de 1992. Todos los
detalles de ventas desde 1982 (o cuando el diseñador inició la colección de los
archivos) son almacenados en el nivel de detalle de datos más antiguo.
El
detalle actual contiene información desde 1992 a 1993 (suponiendo que 1993 es el año
actual). En general, el detalle de ventas no se ubica en el nivel de detalle
actual hasta que haya pasado, por lo menos, veinticuatro horas desde que la
información de ventas llegue a estar disponible en el ambiente operacional.

En otras palabras, habría un retraso de tiempo de por lo
menos veinticuatro horas, entre el tiempo en que en el ambiente operacional se
haya hecho un nuevo ingreso de la venta y el momento cuando la información de
la venta haya ingresado al data warehouse.
El
detalle de las ventas son resumidas semanalmente por línea de subproducto y por
región, para producir un almacenamiento de datos ligeramente resumidos.
El
detalle de ventas semanal es adicionalmente resumido en forma mensual, según
una gama de líneas, para producir los datos completamente resumidos.
La
metadata contiene (al menos):
- La estructura de los datos
- Los algoritmos usados para la
esquematización
- El mapping desde el ambiente
operacional al data warehouse
La
información adicional que no se esquematiza es almacenada en el data warehouse.
En muchas ocasiones, allí se hará el análisis y se producirá un tipo u otro de
resumen. El único tipo de esquematización que se almacena permanentemente en el
data warehouse, es el de los datos que son usados frecuentemente. En otras
palabras, si un analista produce un resumen que tiene una probabilidad muy baja
de ser usado nuevamente, entonces la esquematización no es almacenada en el
data warehouse.