La
incorporación de Business Inteligence como estrategia
competitiva dentro de la empresa
[Tecnología]
por [Licenciado
Fausto Sosa de la Fuente: Estudiante de la EGADE, Monterrey
NL]
2.
Análisis de componentes de BI
Datawarehouse:
El
principal componente del esquema de BI es sin lugar a dudas
el datawarehouse, como definición podemos mencionar
la original de Bill Imon: "a subject-oriented, integrated,
time-variant, nonvolatile collection of data in support
of management´s decisión-making" .
Un
datawarehouse (ver figura 1) básicamente es un repositorio
de información integrada, la cual esta disponible
para la ejecución de queries y realización
de análisis. En este esquema los datos e información
son extraídos de una serie de fuentes heterogéneas
al momento que estas son generadas.
Figura
1. Datawarehouse

Una
solución de datawarehouse permite a las compañías
obtener el máximo beneficio sobre sus datos, a su
vez el objetivo del datawarehouse es hacer que la información
sea más fácilmente accesable por parte de
todos los usuarios que la requieren para su transformación,
depuración y almacenamiento de datos en una base
de datos dedicada, la cual es totalmente independiente de
los sistemas de producción (OLTP).
Es
importante señalar que en estos tiempos las necesidades
de las corporaciones por obtener información cambiante,
en tiempos rápidos, con calidad y de manera dinámica
para satisfacer las necesidades de sus ejecutivos no es
solo critica para la obtención de una ventaja competitiva,
sino que juega un papel fundamental para la sobrevivencia
de los negocios. Es por ello que en los recientes años
muchas empresas han hecho inversiones fuertes en iniciativas
de implantación de datawarehouses a nivel organización.
Sin embargo se ha visto que los alcances definidos en proyectos
de datawarehouse han sido de dimensiones altas y por ende
su costo ha sido alto. Esto ha generado que los usuarios
en ocasiones presenten actitudes negativas ante estas implantaciones
argumentando bajo performance en la explotación de
información y a su vez que el warehouse no es capaz
de seguir el paso a las cambiantes demandas de necesidades
en el negocio.
Lo
anterior nos enlaza con un termino denominado Data mart
(ver figura 2), el cual puede ser descrito como aquel base
de datos que esta dedicada a una actividad particular. Estas
actividades pueden ser por ejemplo información de
un departamento de finanzas, mercadotecnia ó cualquier
grupo en particular que trabaje en conjunto.
En
cuanto a los tipos de Data marts podemos decir que existen
dos clasificaciones, el data mart independiente, conocido
a su vez como datawarehouse departamental y el data mart
dependiente, el cual está ligado al datawarehouse
institucional, desde el cual obtiene los datos con el propósito
de cumplir con los requerimientos del área o grupo
en cuestión. En conclusión un Datamart se
puede visualizar como una versión pequeña
de un dataware house.
Figura
2. Data mart

Bases
de datos relacionales vs dimensionales
Un
tema que se ha venido comentando en los últimos meses
es el dilema de que tipo de base de datos es mejor para
la construcción de un datawarehouse.
Es
por ello que quisiera entrar en un poco más de detalle
en cuanto a este tema y mencionar que si bien es cierto
se ha venido asociando el termino de datawarehousing con
OLAP y con tecnología de base de datos multidimensional,
aunado a que un modelo de esta naturaleza debe estar sustentado
en un diagrama de estrella (ver figura 3).
Sin
embargo existen vertientes que señalan que es más
adecuado el utilizar dichos diseños de bases de datos
para el caso de los data marts y en cambio utilizar modelos
relacionales de bases de datos cuando se trata de creación
de datawarehouse.
Figura
3. Star Schema

Las
razones por las cuales algunos expertos recomiendan dicha
decisión se basa en los siguientes aspectos:
-
Dichos
diseños requieren de una preagrupación
de datos dentro del datawarehouse, lo cual al eliminar
mucha de la información proveniente del sistema
transaccional, se pierde información.
-
Los
modelos optimizados como el de star schema suelen ser
mucho menos flexibles en relación con los diseños
normalizados, lo que dificulta el reflejar cambios en
reglas o el contar con nuevos requerimientos.
-
Otro
factor es que dichos diseños asumen que todos
los queries son de naturaleza cuantitativa, lo cual
elimina los beneficios de explotar repositorios basados
en texto o información cualitativa.
Finalmente
podemos concluir que en este sentido los Data Marts proveen
una solución ideal para tal vez el punto de conflicto
más común en este tema -desempeño vs
flexibilidad. Esto debido a que entre más normalizado
y flexible sea un modelo de datawarehouse, su performance
es menor al momento de realizar los queries, ya que la ejecución
de queries en diseños normalizados requiere de un
mayor número de operaciones tipo join, lo cual en
un modelo optimizado (star schema) no se presenta.
Por
ello mismo lo óptimo es contar con un modelo de datawarehouse
que te permita contar con la flexibilidad y escalabilidad
necesaria y a su vez direccionar los queries sobre un modelo
de data mart, evitando de esta forma ver sacrificado el
tema de desempeño de los mismos.
Con
esto podemos concluir que en materia de datawarehouse es
importante considerar los factores críticos que se
persiguen con el objetivo de estructurar un modelo que satisfaga
los requerimientos específicos de cada empresa, evitando
incurrir en costos innecesarios.
|