| DATA WAREHOUSE |
El mundo de los Decision Suport Systems en adelante DSS ha creado varias arquitecturas de información. La más notable de las estructuras DSS es el Data warehouse. El Data warehouse contiene datos históricos que son comunes en toda la organización, la información puede estar sumarizada y/o detallada.
Los datos que alimentan los sistemas de Data warehouse los proporcionan los sistemas operacionales, también denominados sistemas de ejecución de procesos de negocios. El Data warehouse casi siempre es un sistema de datos guardados físicamente en estructuras separadas, los datos son transformados a partir de los datos proporcionados por los sistemas operacionales.
El potencial de la explotación de los datos (Data Mining) puede realzarse si de manera apropiada los datos son recolectados y guardados en un almacén o depósito de datos (Data warehouse). Un almacén de datos o Data warehouse es un sistema de gestión de bases de datos relacional diseñado específicamente para ofrecer las necesidades de los sistemas de análisis de la información. Se trata de una nueva técnica que posibilita la extracción de datos de los sistemas operacionales. También facilita la integración y homogeneización de los datos de toda la empresa. En otras palabras el almacén de datos provee datos que ya han sido transformados y sumarizados, por lo tanto crea el entorno apropiado para un uso más eficiente de las herramientas DSS y EIS.
| PROCESOS EN EL DISEÑO DE UN DATA WAREHOUSE |
La primera fase en el diseño de un sistema de almacén de datos consiste en aislar el actual sistema de información operacional, para preservar la seguridad y la integridad de las aplicaciones de misión críticas de OLTP. La base de datos resultante o almacén de datos puede consumir cientos de gigabytes o incluso de terabytes de espacio en disco. Existen técnicas para guardar y obtener grandes cantidades de información. Empresas con volúmenes de información enormes pueden requerir el uso de sistemas de procesamiento en paralelo para así obtener el ancho de banda suficiente.
Los procesos de transformación y movimiento de los datos pueden ejecutarse en cualquier momento cada vez que se necesite actualizar el almacén de datos mediante funciones especiales. La información que describe el modelo y la definición de los elementos de datos fuente se llama metadatos. Los metadatos son las unidades de información mínimas que manejarán los usuarios del almacén de datos y como mínimo incluirán:
La limpieza de los datos en el sistema de información del entorno operacional es uno de los aspectos más importantes, consiste en eliminar parte de los datos operacionales, tales como información de transacciones de bajo nivel, los cuales por su elevado volumen inciden negativamente en los tiempos de ejecución de las consultas. Los datos que a nivel operacional ya no son operativos deberían extraerse de las fuentes de producción a intervalos regulares eliminándolos del sistema de información operacional y traspasándolos al almacén de datos o Data warehouse.
| SISTEMAS DE DATA WAREHOUSE Y OLTP |
Una base de datos para soportar procesos transaccionales en línea (OLTP), puede no ser adecuada para el Data warehouse ya que ha sido diseñada para maximizar la capacidad transaccional de sus datos y tipicamente tiene cientos de tablas la gran mayoría normalizadas. Su diseño también ha sido condicionado por los procesos operacionales que deberá soportar para la óptima actualización de sus datos, normalmente muchas de sus tablas en constantes y continuos cambios. Los sistemas Data warehouse están orientados a procesos de consultas en contraposición con los procesos transaccionales.
|
OLTP |
Data Warehouse | |
|
Propósito |
Ejecuta operaciones transaccionales diariamente |
Consultas y análisis para la obtención de información |
|
Estructura |
Sistemas de bases de datos relacionales |
Normalmente sistemas de bases de datos relacionales |
|
Modelo de datos |
Normalizado |
Muchas de sus tablas pueden no estar normalizadas se admite redundancia en los datos. Bases de datos multidimensionales. |
|
Acceso |
SQL |
SQL más extensiones especiales dependientes de las
herramientas de explotación de datos (Data Mining) |
|
Tipo de datos |
Los datos están orientados a la gestión de los negocios |
Los datos están orientados al análisis de los
negocios. |
|
Perdurabilidad |
Los datos cambian constantemente, vistos globalmente en procesos de reporting sofisticados pueden perder consistencia, o bien, para no perder consistencia deben imponerse mecanismos de bloqueo de datos con un elevado consumo de recursos globales del sistema. |
Datos históricos con referencias temporales no sujetos a modificaciones. |
| CARACTERISTICAS |
De acuerdo con Bill Inmon, autor de Building the Data warehouse Construyendo el almacén de datos, ampliamante reconocido como el gurú creador del concepto data warehousing, existen generalmente cuatro características que describen un almaceén de datos:
| BENEFICIOS |
Datos versus información
Beneficios económicos
|
C onclusión |
Las Data Warehouse representan una tecnología innovadora y un mercado en pleno desarrollo.
Data Warehousing y Data Mining son dos procesos que permiten la Gestión del Conocimiento. El Conociemnto, convertido ahora en el más importante factor de producción, es un recurso clave para cualquier compañía que quiera sobrevivir y medrar en el competitivo y global entorno empresarial de hoy en día. Es importante señalar que este tipo de proyectos en constante evolución de la empresa. Por tanto, se podría decir que nunca tiene fin, que siempre son susceptibles al cambio. "El Data Warehousing no es un destino, sino un viaje"