1. Introducción
2. Data Warehouse
3. Impactos Empresariales.
4.
¿Quiénes y para qué lo usan?
5.
Sistemas De Data Warehouse Y Oltp
6.
Diferencias: Data Warehouse vs. OLTP
7.
Bibliografía
Hoy en día toda empresa
necesita depositar mucha confianza en la toma de
decisiones sobre los negocios, para tomar dichas decisiones requerimos hechos y
cifras, sabemos que la competencia
crece en todo momento entonces las decisiones que debemos tomar en nuestra empresa
deben ser mas aceleradas; pero que pasa si tenemos una montaña de información
la cual debe ser analizada, lógicamente pensamos que necesitaríamos mucho tiempo.
Por ese motivo se requieren herramientas que nos ayuden a minimizar el tiempo
para analizar mucha información
con mayor velocidad y precisión; utilizando dichas herramientas logramos mantenernos competitivos, ya que
nuestros negocios deben reaccionar al cambio del mercado.
De otro modo el mercado
globalizado, la presión
inmensa de la competencia, los arranques tecnológicos, etc. Debilitaran
nuestra empresa. Esto nos muestra
que las empresas invierten en tecnología
y soluciones con las cuales se mantienen en este mundo
cambiante, ahora las empresas
no dependen tan solo de factores como ubicación, productos, etc. Sino también del conocimiento. Tal conocimiento basado en información comprensible, detallada y
relevante es crucial para lograr y sostener ventaja competitiva. El poseer
conocimientos correctos significa tener respuestas correctas y realizar
decisiones estratégicas para la ejecución de la empresa.
Pero las tareas de recolectar, procesar, limpiar y transformar la información
necesaria para la toma de
decisiones no es una tarea sencilla mas si consideramos que una empresa
tiene distintas áreas que a veces se encuentran alejadas de los ejecutivos de
negocios.
El Componente de Bussines Intelligence que
resuelve este caos de los datos
es el Data Warehouse.
El Data Warehouse
es un conjunto de procesos y acciones, es una colección de datos
orientados a un tema, integrados y no volátiles en el soporte al proceso de toma de decisiones de la gerencia.
Los Alumnos.
¿Qué es Data Warehousing?
En la actualidad hay una importante cantidad
de confusión respecto a lo que es un Data Warehouse que, afortunadamente, está
comenzando a despejarse. No obstante, parece que cada proveedor de un producto o servicio relacionado con tecnología
informática tiene su definición y, lo que es peor, en su
propia jerga no siempre comprensible.
Algunos llaman a Datawahouse Business
Intelligence or Decision Support en realidad es considerada la solución
integral y oportuna para desarrollar negocio el Datawarehouse
se caracteriza por ser:
Integrado - Temático - Histórico - No
volatil
Definición :
Es un proceso, no un producto. Es una técnica para consolidar y administrar datos
de variadas fuentes con el propósito de responder preguntas de negocios y
tomar decisiones, de una forma que no era posible hasta ahora.
Consolidar datos desde una variedad de fuentes. Dentro del marco conceptual de Data Warehousing los
agruparemos dentro del proceso de Transformación de Datos.
Manejar grandes volúmenes de datos de una
forma que no era posible, o no era costo
efectiva. A estos medios los agruparemos en Procesamiento y Administración de Datos.
Acceder a los datos de una forma más
directa, en "el lenguaje del negocio", y analizarlos para obtener
relaciones complejas entre los mismos. Estos procesos se engloban en dos categorías que serán explicadas
más adelante: Acceso a los Datos y Descubrimiento o Data Mining.
Estos desarrollos tecnológicos,
correctamente organizados e interrelacionados, constituyen lo que se ha dado en
llamar un Data Warehouse o Bodega de Datos. Veamos un poco más en detalle los grupos
mencionados.
Existen muchas definiciones para el DW, la
más conocida fue propuesta por Inmon[MicroSt96] (considerado el padre de las Bases de Datos)
en 1992: "Un DW es una colección de datos orientados a temas, integrados,
no-volátiles y variante en el tiempo, organizados para soportar necesidades
empresariales". En 1993, Susan Osterfeldt[MicroSt96] publica una
definición que sin duda acierta en la clave del DW: "Yo considero al DW
como algo que provee dos beneficios empresariales reales: Integración
y Acceso de datos. DW elimina una gran cantidad de datos inútiles y no deseados,
como también el procesamiento desde el ambiente operacional clásico".
Data Mining
En este sentido un sistema
Datamining es una tecnología de soporte para usuario final, cuyo objetivo es extraer conocimiento útil y utilizable a partir de
la información contenida en las bases de datos
de las empresas.
Los objetivos de un sistema
Datamining nos permitiría analizar factores de influencia en determinados
procesos, predecir o estimar variables o comportamientos futuros, sementar o agrupar ítems
similares, además de obtener secuencias de eventos
que provocan comportamientos específicos.
Los sistemas
Datamining se desarrollan bajo lenguajes de ultima generación basados en la inteligencia artificial y utilizando métodos
matemáticos, tales como:
·
Redes
euronales
·
Introducción
de reglas
·
Arboles
de decisión
·
Conjunto
de reglas por clase
Soporta tambien sofisticadas operaciones
de análisis tales como los sistemas
Scoring y aplicaciones de detección de fraude.
Data Marts
Es un pequeños Data Warehouse, para un
determinado numero de usuarios, para un arrea funcional, especifica de la
compañía. También podemos definir que un Data Martes es un subconjunto de una
bodega de datos para un propósito especifico.
Su función
es apoyar a otros sistemas para la toma de decisiones.
Los procesos que conforma el datawarehouse
son:
1-Extraccion
2- Elaboración
3-Carga
4-Explotacion
Componentes del Data Warehouse
Impactos DW
El éxito de DW no está en su construcción, sino en usarlo para mejorar procesos
empresariales, operaciones y decisiones. Posesionar un DW para que sea usado
efectivamente, requiere entender los impactos de implementación en los
siguientes ámbitos:
Impactos Humanos.
Efectos sobre la gente de la empresa:
Construcción del DW: Construir un DW
requiere la participación activa de quienes usarán el DW. A diferencia del desarrollo de aplicaciones, donde los requerimientos de la
empresa logran ser relativamente bien definidos producto de la estabilidad de
las reglas de negocio a través del tiempo, construir un DW depende de la
realidad de la empresa como de las condiciones que en ese momento existan, las
cuales determinan qué debe contener el DW. La gente de negocios debe participar
activamente durante el desarrollo del DW, desde una perspectiva de construcción y creación. •Accesando el DW: El DW intenta
proveer los datos que posibilitan a los usuarios accesar su propia información
cuando ellos la necesitan. Esta aproximación para entregar información tiene
varias implicancias:
a) La gente de la empresa puede necesitar
aprender nuevas destrezas.
b) Análisis extensos y demoras de programación
para obtener información será eliminada. Como la información estará lista para
ser accesada, las expectativas probablemente aumentarán.
c) Nuevas oportunidades pueden existir en la comunidad
empresarial para los especialistas de información.
d) La gran cantidad de reportes en papel serán reducidas o eliminadas.
e) La madurez del DW dependerá del uso activo y retroalimentación de sus usuarios.
Usando aplicaciones DSS/EIS: usuarios de
aplicaciones DSS y EIS necesitarán menos experiencia para construir su propia
información y desarrollar nuevas destrezas.
Procesos Empresariales Y Decisiones
Empresariales.
Se deben considerar los beneficios empresariales
potenciales de los siguientes impactos:
a) Los Procesos de Toma de Decisiones pueden
ser mejorados mediante la disponibilidad de información. Decisiones
empresariales se hacen más rápidas por gente más informada.
b) Los procesos empresariales pueden ser optimizados. El tiempo perdido
esperando por información que finalmente es incorrecta o no encontrada, es
eliminada.
c) Conexiones y dependencias entre procesos empresariales se vuelven más claros
y entendibles. Secuencias de procesos empresariales pueden ser optimizados para
ganar eficiencia y reducir costos.
d) Procesos y datos de los sistemas
operacionales, así como los datos en el DW, son usados y examinados. Cuando los
datos son organizados y estructurados para tener significado empresarial, la
gente aprende mucho de los sistemas de
información. Pueden quedar expuestos posibles defectos en
aplicaciones actuales, siendo posible entonces mejorar la calidad
de nuevas aplicaciones. Comunicación
e Impactos Organizacionales.
Apenas el DW comienza a ser fuente primaria
de información empresarial consistente, los siguientes impactos pueden comenzar
a presentarse:
a) La gente tiene mayor confianza en las
decisiones empresariales que se toman. Ambos, quienes toman las decisiones como
los afectados conocen que está basada en buena información.
b) Las organizaciones empresariales y la gente de la cual ella se
compone queda determinada por el acceso a la información. De esta manera, la
gente queda mejor habilitada para entender su propio rol y responsabilidades
como también los efectos de sus contribuciones; a la vez, desarrollan un mejor
entendimiento y apreciación con las contribuciones de otros.
c) La información compartida conduce a un lenguaje común, conocimiento común, y mejoramiento de la comunicación en la empresa. Se mejora la confianza y
cooperación entre distintos sectores de la empresa , viéndose reducida la
sectorización de funciones.
d) Visibilidad, accesibilidad, y conocimiento de los datos producen mayor
confianza en los sistemas operacionales.
Impactos Técnicos De DW.
Considerando las etapas de construcción,
soporte del DW y soporte de sistemas operacionales, se tienen los
siguientes impactos técnicos:
Nuevas destrezas de desarrollo: cuando se
construye el DW, el impacto más grande sobre la gente técnica está dada por la
curva de aprendizaje, muchas destrezas nuevas se deben aprender,
incluyendo:
a) Conceptos y estructura DW.
b) El DW introduce muchas tecnologías nuevas (ETT, Carga, Acceso de Datos,
Catálogo de Metadatos, Implementación de DSS/EIS ), y cambia la manera que
nosotros usamos la tecnología existente. Nuevas responsabilidades de soporte,
nuevas demandas de recursos
y nuevas expectativas, son los efectos de estos cambios.
c) Destrezas de diseño y análisis donde los requerimientos empresariales no
son posibles de definir de una forma estable a través del tiempo.
d) Técnicas
de desarrollo incrementa y evolutivo.
e) Trabajo en equipo cooperativo con gente de negocios como
participantes activos
en el desarrollo del proyecto.
• Nuevas responsabilidades de operación: Cambios sobre los sistemas y
datos operacionales deben ser examinados más cuidadosamente para determinar el
impacto que estos cambios tienen sobre ellos, y sobre el DW.
4. ¿Quiénes y para qué lo
usan?
Dadas las características
de un sistema de Data Warehousing, su aplicación puede tener variados fines, en
una diversidad de industrias.
No obstante, en términos generales, podemos decir que su aplicación más rica
corresponde a entornos de empresas en los que se identifican grandes volúmenes
de datos, asociados a: cantidad de clientes,
variedad de productos y cantidad de transacciones. A continuación veremos
ejemplos de aplicaciones típicas y algunos casos puntuales en distintas industrias.
Comercio Minorista
Utilizan grandes sistemas de Procesamiento
Paralelo Masivo para acceder a meses o años de historia
transaccional tomada directamente en los puntos de venta
de cientos, o miles, de sucursales. Con esta información detallada pueden
efectuar en forma más precisa y eficiente actividades de compra, fijación de precios, manejo de inventarios,
configuración de góndolas, etc.
Las promociones y las ofertas de cupones son
seguidas, analizadas y corregidas. Modas y tendencias son cuidadosamente
administradas a efectos de maximizar utilidades y reducir costos
de inventario. El stock es reasignado por sucursales o regiones
según ventas y tendencias. Estos sistemas con capacidad de procesar
gran cantidad de datos detallados permiten implementar eficientemente prácticas
de mercadería "en consignación", en esta modalidad la cadena
minorista paga al proveedor recién cuando los productos son vendidos y pasados
por el lector de códigos de barras (scanner)
del punto de venta.
Esta información detallada permite ejercer
mayor poder de negociación
sobre los proveedores, dado que el comercio minorista puede llegar a saber más que el fabricante
sobre sus productos: quién lo compra, dónde, cuándo, con que otros productos,
etc.
En su libro "Made in América: My Story" el fundador de Wal*Mart, Sam Walton,
escribe: "...me dicen que es la base de datos
comercial más grande del mundo. Lo que me gusta es la clase de información que
puedo obtener de ella al instante ¡todos esos números!, llevamos 65 semanas de historia
de cada artículo que vendemos. Esto significa que puedo elegir cualquiera y
decir exactamente cuantos vendimos... no en promedio, sino en cualquier región,
distrito o sucursal. Es difícil que un proveedor sepa más acerca de su producto
de lo que sabemos nosotros. Nos da el poder de la ventaja competitiva." Para poner esto en
perspectiva debemos considerar que las sucursales a las que hace referencia Sam
Walton son unas 2500 y que cada una de ellas tiene una variedad de entre 50.000
y 80.000 artículos, todas las noches 20 millones de actualizaciones se realizan
en el Data Warehouse. Wal*Mart es un excelente ejemplo práctico del concepto
planteado por A. Tofler en su libro "Powershift": el poder se desplaza del
fabricante al minorista por el manejo de la información.
Otras instalaciones de Data Warehousing de
magnitud en la industria minorista son las de Kmart, Sears, Meijer, Kohl's
Department Stores, American Stores (Jewel/OSCO/Lucky/Savon/ACME/SuperSaver),
Mervyn's, Buttrey Food & Drug, QVC Home Shopping, Canadian Tyre, WH Smith
Books (Gran Bretaña), Great Universal (GB), Supermercados Casino (Francia), Migrosgenossenschaftsbund (Suiza), Otto Versand (Alemania).
Manufactura de Bienes de Consumo Masivo
Las empresas de este sector necesitan hacer
un manejo cada vez más ágil de la información para mantenerse competitivas en
la industria. Los Data Warehouses se utilizan para predecir la
cantidad de producto que se venderá a un determinado precio y, por consiguiente, producir la cantidad adecuada para
una entrega "justo a tiempo". A su vez se coordina el suministro a las
grandes cadenas minoristas con inmensas cantidades de productos "en
consignación", que no son pagados hasta que estos productos son vendidos
al consumidor final.
Las cadenas minoristas y sus proveedores utilizan sus Data Warehouses para compartir
información, permitiéndole a las empresas de manufactura conocer el nivel de stock en las góndolas y
eventualmente hacerse responsables de la reposición de inventario
de la cadena minorista. Como es de esperar esto reduce fuertemente la
intermediación. También se utilizan para campañas de marketing, planificación
de publicidad y promociones y se coordinan las ofertas de cupones
y promociones con las cadenas minoristas.
Un ejemplo interesante es el de Whirlpool.
Este fabricante global de electrodomésticos con base en Benton Harbor,
Michigan, utiliza su Data Warehouse para hacer un seguimiento directo de sus
casi 15 millones de clientes
y de sus más de 20 millones de aparatos instalados. Las mayores aplicaciones
del sistema son para marketing, ventas, mantenimiento, garantía y diseño de productos. Permite mantener stock de partes más
ajustados y mejorar las condiciones de negociación
con los proveedores de las mismas. Si, por ejemplo, un determinado motor
se identifica como poseedor de una tasa de falla superior, Whirlpool puede
utilizar la información para hacer renegociaciones de garantía con el
proveedor.
Como anécdota interesante se puede mencionar
que durante el verano de 1993 los ingenieros de Whirlpool detectaron una tasa
de falla muy alta en una manguera de conexión en una serie de lavarropas que se
estaba vendiendo. A partir de allí se detuvo la producción, se identificaron los clientes y se enviaron
técnicos a reemplazar la parte defectuosa antes de que entrara en falla. Esto
no solo tuvo un impacto muy importante en satisfacción de clientes sino que se
redujeron los costos de garantía por el reemplazo planificado y, especialmente,
¡se evitaron costosos reclamos por daño a la propiedad debidos a pérdidas de agua!
Otras empresas del sector que cuentan con
Data Warehouses de importancia son: Coca Cola, Nike, Procter & Gamble,
Hallmark, Maybelline, Helene Curtis, 3M, Owens Corning Glass, Karsten Ping Golf
Clubs, Walt Disney.
Transporte de Cargas y Pasajeros
Se utilizan Data Warehouses para almacenar y
acceder a meses o años de datos de clientes y sistemas de reservas para
realizar actividades de marketing, planeamiento
de capacidad, monitoreo de ganancias, proyecciones y análisis de ventas y
costos, programas de calidad
y servicio a clientes.
Las empresas de transporte de cargas llevan datos históricos de años, de
millones de cargamentos, capacidades, tiempos de entrega, costos, ventas,
márgenes, equipamiento, etc..
Las aerolíneas utilizan sus Data Warehouses
para sus programas de viajeros frecuentes, para compartir información
con los fabricantes de naves, para la administración del transporte de cargas, para compras
y administración de inventarios,
etc. Hacen un seguimiento de partes de repuesto, cumplimiento con las
regulaciones aeronáuticas, desempeño de los proveedores, seguimiento de equipaje,
historia de reservas, ventas y devoluciones de tickets, reservas telefónicas,
desempeño de las agencias de viajes, estadísticas de vuelo, contratos
de mantenimiento, etc.
Algunas empresas que cuentan con Data
Warehouses de magnitud: Cornrail, Union Pacific, Norfolk Southern, American
President Lines, Delta, Lufthansa, QANTAS, British Airways, American Airlines,
Canadian Airlines, SNFC.
Telecomunicaciones
Estas empresas utilizan sus Data Warehouses
para operar en un mercado crecientemente competitivo, desregulado y global que,
a su vez, atraviesa profundos cambios tecnológicos. Se almacenan datos de
millones de clientes: sus circuitos, facturas mensuales, volúmenes de llamados, servicios utilizados, equipamiento vendido, configuraciones de
redes,
etc. así como también información de facturación, utilidades, y costos son
utilizadas con propósitos de marketing, contabilidad, reportes gubernamentales, inventarios, compras
y administración de redes. Otras Industrias
Muchas otras industrias y actividades
utilizan actualmente, o están comenzando a instalar, Data Warehouses: entidades
gubernamentales, especialmente para el control
impositivo, empresas de servicios públicos, de entretenimiento, editoriales,
fabricantes de automóviles, empresas de petroleo y gas,
laboratorios farmacéuticos, droguerías, etc.
En la industria informática
NCR dispone de los Data Warehouses de mayor magnitud y antigüedad. Sus mayores
instalaciones se encuentran en distintos centros de la compañía en Estados Unidos.
La de NCR El Segundo, California, es una de las más antiguas del mundo, su
primera aplicación fue el seguimiento histórico y detallado de la base de
clientes: llamados de servicios, productos instalados, performances, etc. Esta
instalación es herencia de Teradata, compañía fundada en 1979 para la producción de sistemas de procesamiento paralelo masivo
destinados a aplicaciones de soporte a la toma de decisiones y posteriormente
adquirida por NCR.
En NCR San Diego, California, se encuentra
el centro de desarrollo de los computadores WorldMark. Sobre los mismos se
realizó la demostración del Data Warehouse más grande del mundo: 10 Terabytes
de información (=10.000 Gigabytes=10.000.000 Megabytes), para poner esto en
términos manejables debemos considerar que toda la información escrita de la Biblioteca
del Congreso de los Estados Unidos
se podría almacenar en unos 20 Terabytes.
En NCR Dayton, Ohio, la compañía dispone de
un Data Warehouse de 1 Terabyte (=1000 Gigabytes) destinado fundamentalmente a
tareas de marketing, producción y finanzas. A la fecha tiene almacenados 281.154 documentos,
agrupados en 36 grupos
de interés
temático, que pueden ser accedidos 24 Hs. al día, los siete días de la semana,
por 16.100 usuarios distribuidos en 46 países. A principios
del año 1996 el sistema estaba respondiendo un promedio de 242.707 consultas
mensuales.
Diagrama de Funcionamiento
¿Cómo trabaja el Data Warehouse?
·
Extrae
la información operacional.
·
Transforma
la operación a formatos consistentes.
·
Automatiza
las tareas de la información para prepararla a un análisis eficiente.
¿En quê podemos usarlo?
·
Manejo
de relaciones de marketing.
·
Análisis
de rentabilidad.
·
Reducción
de costos.
Busines Intelligence se ha vuelto una
necesidad en el vertiginoso ritmo del ambiente de negocios actual. Los negocios necesitan aprovechar
las posibilidades que les ofrece la actual tecnología para permanecer
competitivos y rentables.
OLAP
Es un sinónimo de base de datos
multidimensional mediante las cuales se proveen una tecnología para el cálculo
y análisis requerido por las aplicaciones analíticas para el "Bussines
Intellingence", las bases de datos relacionadas están formadas por un
conjunto de registros. Cada registro
contiene la información organizada en campos.
El OLAP describe la tecnología asociada al
acceso y análisis de datos en líneas.
5. Sistemas De Data
Warehouse Y Oltp
Una base de datos para soportar procesos
transaccionales en línea (OLTP), puede no ser adecuada para el Data Warehouse
ya que ha sido diseñada para maximizar la capacidad transaccional de sus datos
y tipicamente tiene cientos de tablas la gran mayoría normalizadas. Su diseño
también ha sido condicionado por los procesos operacionales que deberá soportar
para la óptima actualización de sus datos, normalmente muchas de sus tablas en
constantes y continuos cambios. Los sistemas Data Warehouse están orientados a
procesos de consultas en contraposición con los procesos transaccionales.
OLTPData WarehousePropósitoEjecuta
operaciones transaccionales diariamenteConsultas y análisis para la obtención
de informaciónEstructuraSistemas de bases de datos relacionalesNormalmente
sistemas de bases de datos relacionalesModelo de datosNormalizadoMuchas de sus
tablas pueden no estar normalizadas se admite redundancia en los datos. Bases
de datos multidimensionales.AccesoSQLSQL más extensiones especiales
dependientes de las herramientas de explotación de datos (Data Mining)
No obstante, el SQL estándar puede ser suficiente en manos de personal
experto.Tipo de datosLos datos están orientados a la gestión de los negociosLos datos están orientados al análisis
de los negocios.
Transforman los datos en información para su
análisis. Perdurabilidad Los datos cambian constantemente, vistos globalmente
en procesos de reporting sofisticados pueden perder consistencia, o bien, para
no perder consistencia deben imponerse mecanismos de bloqueo de datos con un
elevado consumo de recursos
globales del sistema.Datos históricos con referencias temporales no sujetos a
modificaciones.
Características
De acuerdo con Bill Inmon, autor de Building
the Data Warehouse Construyendo el almacén
de datos, ampliamante reconocido como el gurú creador del concepto
data warehousing, existen generalmente cuatro características
que describen un almaceén de datos:
1.orientado al sujeto:
Los datos se organizan de acuerdo al sujeto
en vez de la aplicación, por ejemplo, una compañia de seguros
usando un almacén de datos podría organizar sus datos por cliente,
premios, y reclamaciones, en lugar de por diferentes productos (automóviles,
vida, etc.). Los datos organizados por sujetos contienen solo la información
necesaria para los procesos de soporte para la toma de decisiones.
2.integrados:
Cuando los datos residen en muchas
aplicaciones separados por los distintos entornos operacionales, la
descodificación de los datos es a menudo inconsistente. Por ejemplo, en una
aplicación, la palabra gender podría codificarse como "m" y
"f" en otra como "0" y "1". cuando los datos fluyen
de un entorno operacional a un entorno de almaceén de datos o de data
warehouse, ellos asumen una codificación consistente, por ejemplo gender
siempre se transformaría a "m" y "f".
3.variación-temporal:
El almaceén de datos contiene un lugar para
guardar datos con una antiguedad de 5 a diez años, o incluso más antiguos, para
poder ser usados en comparaciones, tendencias y previsiones. Estos datos no se
modificarán.
4. No son inestables:
Los datos no serán modificados o cambiados
de ninguna manera una vez ellos han sido introducidos en el almacén de datos,
solamente podrán ser cargados, leidos y/o accedidos.
Soluciones Deister
El sistema DEISTER ERP/1 integra datos del sistema OLTP y permite producir
DataMarts. Estos DataMarts constituyen los sillares sobre los que la empresa
puede construir su sistema de Data Warehouse.
El sistema DEISTER ERP/1 puede ser conectado a productos Data Warehouse de
diversos fabricantes como por ejemplo Informix-MetaCube. La familia de productos INFORMIX-MetaCube permitirá gestionar
y explorar los Data Warehouse de su organización:
INFORMIX-MetaCube Warehouse Manager
Ofrece a los administradores de las bases de
datos una herramienta gráfica para manejar los metadata que describen el
almacén de datos de una manera lógica y amigable. Simplemente con puntera y clikar mediante
el ratón, puede verse y modificarse el modelo de los DataMarts sobre los cuales los usuarios
dependerán para acceder a los datos que componen el Data Warehouse.
INFORMIX-MetaCube Aggregator
En la medida que el Data Warehouse o almacén
de datos madure, se irán incorporando volúmenes de datos los cuales alcanzarán
a terabytes de datos. Y es por esto que se requiere una utilidad
de optimización y agregación de datos. Con INFORMIX-MetaCube Aggregator podemos
fácilmente adminstrar y afinar el Data Warehouse según las necesidades de
soporte a la toma de decisiones creando y manteniendo datos pre-calculados y
sumarizados, conocidos como datos agregados. ¿ El resultado ? Se obtendrán
mejoras de órdenes de magnitud en el rendimiento de los sistemas de soporte a
la toma de decisiones DSS.
INFORMIX-MetaCube Explorer
Convertir un Data Warehouse en un sistema de
soporte a la toma de decisiones significa no solamente gestionar enormes
volúmenes de datos, también debe proveer métodos
efectivos y fáciles para acceder y analizar los datos. INFORMIX-MetaCube
Explorer provee un entorno de gestión integrando el acceso al Data Warehouse, análisis,
reporting, y gráficos en un simple aplicativo. INFORMIX-MetaCube Explorer
ofrece acceso completo a todas las utilidades del Motor
de Análisis MetaCube, incluye el entorno extensible de análisis, consistente en
un rico juego de funciones
analíticas.
Beneficios
Optimización
Las estructuras de datos operacionales están orientadas a una
explotación mediante procesos transaccionales en línea (OLTP), las
características de sus tablas y registros.
Datos versus información
El Data Warehouse con las herramientas
adecuadas nos permitirá obtener o realizar análisis, reporting, extracción y
exploración de los datos para, en suma, transformar los datos en información
útil para nuestra organización.
Beneficios económicos
Normalmente los beneficios económicos que
podemos obtener de un Data Warehouse no tienen la inmediatez de los que pueden
obtenerse mediante un efeciente sistema de
información operacional, por lo general mediante los Data Warehouse
o Almacenes
de datos hemos de esperar el ahorro de gastos
motivados por los cambios que puedan sugerirse en la gestión de nuestra empresa
en el medio y largo plazo.
¿Por quê usarlo un Data Ware House?
·
La
información sumarizada es almanezada en el D.W.
·
Obtiene
respuestas en tiempos razonables.
·
Analiza
desde una perspectiva en el tiempo con la información histórica que se brinde.
·
Nos
permite tener fuentes externas para ayudar a nuestra información.
·
La
información proveniente de fuentes operacionales es transformada y limpiada
para lograr consistencia.
6. Diferencias: Data
Warehouse vs. OLTP
Los sistemas tradicionales de transacciones
y las aplicaciones de Data Warehousing son polos opuestos en cuanto a sus
requerimientos de diseño y sus características de operación. Es de suma
importancia comprender perfectamente estas diferencias para evitar caer en el
diseño de un Data Warehouse como si fuera una aplicación de transacciones en
línea (OLTP).
Las aplicaciones de OLTP están organizadas
para ejecutar las transacciones para los cuales fueron hechos, como por ejemplo:
mover dinero entre cuentas,
un cargo o abono, una devolución de inventario, etc. Por otro lado, un Data
Warehouse está organizado en base a conceptos, como por ejemplo: clientes,
facturas, productos, etc.
Otra diferencia radica en el número de
usuarios. Normalmente, el número de usuarios de un Data Warehouse es menor al
de un OLTP. Es común encontrar que los sistemas transaccionales son accesados
por cientos de usuarios simultáneamente, mientras que los Data Warehouse sólo
por decenas. Los sistemas de OLTP realizan cientos de transacciones por segundo
mientras que una sola consulta de un Data Warehouse puede tomar minutos. Otro
factor es que frecuentemente los sistemas transaccionales son menores en tamaño
a los Data Warehouses, esto es debido a que un Data Warehouse puede estar
formado por información de varios OLTP´s.
Existen también diferencia en el diseño,
mientras que el de un OLPT es extremadamente normalizado, el de un Data
Warehouse tiende a ser desnormalizado. El OLTP normalmente está formado por un
número mayor de tablas, cada una con pocas columnas, mientras que en un Data
Warehouse el número de tablas es menor, pero cada una de éstas tiende a ser
mayor en número de columnas.
Los OLTP son continuamente actualizados por
los sistemas operacionales del día con día, mientras que los Data Warehouse son
actualizados en batch de manera periódica.
Las estructuras de los OLTP son muy estables, rara vez cambian,
mientras las de los Data Warehouses sufren cambios constantes derivados de su evolución. Esto se debe a que los tipos de consultas a los cuales
están sujetos son muy variados y es imposible preverlos todos de antemano.
Costos De Un DW
Costos De Construcción
Los costos de construir un DW son similares para cualquier proyecto
de tecnología de información. Estos pueden ser clasificados en
tres categorías:
RRHH: la
gente necesita contar con un enfoque fuerte sobre el conocimiento del área de la empresa y de los procesos
empresariales. Además es muy importante considerar las cualidades de la gente,
ya que el desarrollo del DW requiere participación de la gente de negocios como
de los especialistas tecnológicos; estos dos grupos de gente deben trabajar
juntos, compartiendo su conocimiento y destrezas en un espíritu de equipo de
trabajo, para enfrentar los desafíos de desarrollo del DW.
Tiempo: Se
debe establecer el tiempo no tan solo para la construcción y entrega de
resultados del DW, sino también para la planeación
del proyecto y la definición de la arquitectura.
La planeación y la arquitectura,
establecen un marco de referencia y un conjunto de estándares que son
críticos para la eficacia
del DW.
Tecnología:
Muchas tecnologías nuevas son introducidas por el DW. El costo
de la nueva tecnología puede ser tan sólo la inversión inicial del proyecto.
Costos De
Operación
Una vez que está construido y entregado un DW debe ser soportado para que tenga
valor empresarial. Son justamente estas actividades de
soporte, la fuente de continuos costos operacionales para un DW. Se pueden
distinguir tres tipos de costos de operación:
Evolutivos:
ajustes continuos del DW a través del tiempo, como cambios de expectativas y,
cambios producto del aprendizaje
del RRHH del proyecto mediante su experiencia usando el DW.
Crecimiento:
Incrementos en el tiempo en volúmenes de datos, del número de usuarios del DW,
lo cual conllevará a un incremento de los recursos necesarios como a la demanda de monitoreo, administración y sintonización del DW
(evitando así, un incremento en los tiempos de respuesta y de recuperación de
datos, principalmente).
Cambios: El
DW requiere soportar cambios que ocurren tanto en el origen de datos que éste
usa, como en las necesidades de la información que éste soporta.
Los dos
primeros tipos de costos de operación, son básicos en la mantención de
cualquier sistema de información, por lo cual no nos resultan ajenos;
sin embargo, se debe tener especial cuidado con los costos de operación por
cambios, ya que ellos consideran el impacto producto de la relación del OLTP y
del Ambiente Empresarial, con el DW.
Resulta
esencial para llevar a cabo un proyecto DW, tener claridad en la forma que éste
se ve afectado por medio de cambios a nivel de OLTP como del Ambiente
Empresarial; por ello entonces, a continuación se analiza más en detalle este
tipo de costos de operación.
Cambios y
el DW.
Cuando se implementa un DW, el impacto de cambios es compuesto. Dos orígenes
primarios de cambios existen:
Cambios en el ambiente empresarial: Un cambio en el ambiente empresarial puede cambiar las
necesidades de información de los usuarios. Así, el contenido del DW se puede
ver afectado y las aplicaciones DSS y EIS pueden requerir cambios.
Cambios en
la tecnología: Un cambio en la tecnología puede afectar la manera que los datos
operacionales son almacenados, lo cual implicaría un ajuste en los procesos de
Extracción, Transporte y Carga para adaptar las variaciones presentadas.
Un cambio de cualquiera de ellos impacta los
sistemas operacionales. Un cambio en el ambiente operacional puede cambiar el
formato, estructura o significado de los datos operacionales usados como
origen para el DW. De esta forma serían impactados los procesos de Extracción,
Transformación y Carga de datos.
Valor Del
DW
El valor de un DW queda descrito en tres dimensiones:
1. Mejorar la Entrega de Información: información completa, correcta,
consistente, oportuna y accesible. Información que la gente necesita, en el
tiempo que la necesita y en el formato que la necesita.
2. Mejorar el Proceso de Toma de Decisiones: con un mayor soporte de
información se obtienen decisiones más rápidas; así también, la gente de
negocios adquiere mayor confianza en sus propias decisiones y las del resto, y
logra un mayor entendimiento de los impactos de sus decisiones.
3. Impacto Positivo sobre los Procesos Empresariales: cuando a la gente se le
da acceso a una mejor calidad de información, la empresa puede lograr por sí
sola:
Eliminar
los retardos de los procesos empresariales que resultan de información
incorrecta, inconsistente y/o no existente.
Integrar y optimizar procesos empresariales a través del uso compartido e
integrado de las fuentes de información.
Eliminar la
producción y el procesamiento de
datos que no son usados ni necesarios, producto de aplicaciones mal
diseñados o ya no utilizados.
Costos v/s
Valor De DW
En todo proyecto es importante e inevitable realizar un análisis desde
la perspectiva Costo/Valor.
A grandes rasgos, los costos asociados a un proyecto DW incluyen el costo de
construcción y, la mantención y operación una vez que está construido. En
cuanto al valor, éste considera, el valor de mejorar la entrega de información,
el valor de mejorar el proceso de toma de decisiones y el valor agregado para
los procesos empresariales.