OMEGA - Boletín del Departamento de Sistemas Boletín del
Departamento de Sistemas
Universidad de
San Buenaventura
Cali, Colombia

...

Número 22, Mayo  2002





La incorporación de Business Inteligence como estrategia competitiva dentro de la empresa [Tecnología] por [Licenciado Fausto Sosa de la Fuente: Estudiante de la EGADE, Monterrey NL]

2. Análisis de componentes de BI

Datawarehouse:
El principal componente del esquema de BI es sin lugar a dudas el datawarehouse, como definición podemos mencionar la original de Bill Imon: "a subject-oriented, integrated, time-variant, nonvolatile collection of data in support of management´s decisión-making" .

Un datawarehouse (ver figura 1) básicamente es un repositorio de información integrada, la cual esta disponible para la ejecución de queries y realización de análisis. En este esquema los datos e información son extraídos de una serie de fuentes heterogéneas al momento que estas son generadas.

Figura 1. Datawarehouse

Una solución de datawarehouse permite a las compañías obtener el máximo beneficio sobre sus datos, a su vez el objetivo del datawarehouse es hacer que la información sea más fácilmente accesable por parte de todos los usuarios que la requieren para su transformación, depuración y almacenamiento de datos en una base de datos dedicada, la cual es totalmente independiente de los sistemas de producción (OLTP).

Es importante señalar que en estos tiempos las necesidades de las corporaciones por obtener información cambiante, en tiempos rápidos, con calidad y de manera dinámica para satisfacer las necesidades de sus ejecutivos no es solo critica para la obtención de una ventaja competitiva, sino que juega un papel fundamental para la sobrevivencia de los negocios. Es por ello que en los recientes años muchas empresas han hecho inversiones fuertes en iniciativas de implantación de datawarehouses a nivel organización. Sin embargo se ha visto que los alcances definidos en proyectos de datawarehouse han sido de dimensiones altas y por ende su costo ha sido alto. Esto ha generado que los usuarios en ocasiones presenten actitudes negativas ante estas implantaciones argumentando bajo performance en la explotación de información y a su vez que el warehouse no es capaz de seguir el paso a las cambiantes demandas de necesidades en el negocio.

Lo anterior nos enlaza con un termino denominado Data mart (ver figura 2), el cual puede ser descrito como aquel base de datos que esta dedicada a una actividad particular. Estas actividades pueden ser por ejemplo información de un departamento de finanzas, mercadotecnia ó cualquier grupo en particular que trabaje en conjunto.

En cuanto a los tipos de Data marts podemos decir que existen dos clasificaciones, el data mart independiente, conocido a su vez como datawarehouse departamental y el data mart dependiente, el cual está ligado al datawarehouse institucional, desde el cual obtiene los datos con el propósito de cumplir con los requerimientos del área o grupo en cuestión. En conclusión un Datamart se puede visualizar como una versión pequeña de un dataware house.

Figura 2. Data mart

Bases de datos relacionales vs dimensionales

Un tema que se ha venido comentando en los últimos meses es el dilema de que tipo de base de datos es mejor para la construcción de un datawarehouse.

Es por ello que quisiera entrar en un poco más de detalle en cuanto a este tema y mencionar que si bien es cierto se ha venido asociando el termino de datawarehousing con OLAP y con tecnología de base de datos multidimensional, aunado a que un modelo de esta naturaleza debe estar sustentado en un diagrama de estrella (ver figura 3).

Sin embargo existen vertientes que señalan que es más adecuado el utilizar dichos diseños de bases de datos para el caso de los data marts y en cambio utilizar modelos relacionales de bases de datos cuando se trata de creación de datawarehouse.

Figura 3. Star Schema

Las razones por las cuales algunos expertos recomiendan dicha decisión se basa en los siguientes aspectos:

  • Dichos diseños requieren de una preagrupación de datos dentro del datawarehouse, lo cual al eliminar mucha de la información proveniente del sistema transaccional, se pierde información.
  • Los modelos optimizados como el de star schema suelen ser mucho menos flexibles en relación con los diseños normalizados, lo que dificulta el reflejar cambios en reglas o el contar con nuevos requerimientos.
  • Otro factor es que dichos diseños asumen que todos los queries son de naturaleza cuantitativa, lo cual elimina los beneficios de explotar repositorios basados en texto o información cualitativa.

Finalmente podemos concluir que en este sentido los Data Marts proveen una solución ideal para tal vez el punto de conflicto más común en este tema -desempeño vs flexibilidad. Esto debido a que entre más normalizado y flexible sea un modelo de datawarehouse, su performance es menor al momento de realizar los queries, ya que la ejecución de queries en diseños normalizados requiere de un mayor número de operaciones tipo join, lo cual en un modelo optimizado (star schema) no se presenta.

Por ello mismo lo óptimo es contar con un modelo de datawarehouse que te permita contar con la flexibilidad y escalabilidad necesaria y a su vez direccionar los queries sobre un modelo de data mart, evitando de esta forma ver sacrificado el tema de desempeño de los mismos.

Con esto podemos concluir que en materia de datawarehouse es importante considerar los factores críticos que se persiguen con el objetivo de estructurar un modelo que satisfaga los requerimientos específicos de cada empresa, evitando incurrir en costos innecesarios.


 

 

.

Contáctenos
Contáctenos!!
Envíenos sus comentarios sugerencias, inquietudes o suscripciones a omega@usb.edu.co

Wallpapers USB!

Aún no tienes tu Wallpaper de la USB?  Descarga el tuyo aquí

Noticias y Eventos de TI!
Entérese de las noticias y eventos relacionados con Tecnologías de Información

Enlaces....

| Ir a la página principal | Otras Ediciones | Wallpapers USB |
| Editorial | La U | Tecnología | Internet para Usted | | Noticias y Eventos |
| La Hora Internet | Clima de Cali | Trámites Locales | Estado de las Vías |Mapa del Valle|
| Mapa de Cali | Cine en Cali | Páginas Amarillas | Indicadores Económicos | Etiqueta en la Red |
| USB-Linux | USB-Windows | USB-Java | USB-Tecnología | USB-Redes | USB-IngSoftware |


Dirección: Ing. Alfredo Panesso Tascón
Edición: Ings. Diego Fernando Marin Lozano y Martha Lucia Guerrero Muñoz
Imagen y Diseño Gráfico: Departamento de Sistemas USB
COPYRIGHT © 2000 UNIVERSIDAD DE SAN BUENAVENTURA - Cali, Colombia.
Universidad de San Buenaventura - Cali, Colombia - Formacion Integral para el Nuevo MilenioUniversidad de San Buenaventura - Cali, Colombia - Formacion Integral para el Nuevo Milenio
Universidad de San Buenaventura - Cali, Colombia - Formacion Integral para el Nuevo Milenio