Ing. Eligio Antonio Gutiérres Orellana
(Síntesis)
Sub Tema ¿QUÉ ES UNA BASE DE DATOS GEOGRÁFICA?
Resumen
Definir el término Base de Datos
Un conjunto de información almacenada en memoria auxiliar que permite acceso directo y un conjunto de programas que manipulan esos datos.
Base de Datos, es un conjunto exhaustivo no redundante de datos estructurados organizados independientemente de su utilización y su implementación en máquina accesibles en tiempo real y compatibles con usuarios concurrentes con necesidad de información diferente y no predicable en tiempo.
La utilidad de una base de datos geográfica se mide tanto por su contenido como por su actualización.
Se conocen como bases de datos geográficas el conjunto de temas que componen un contenido temático completo.
El formato de las bases de datos hasta el año 2000 eran de tipo "Coberturas" o "Shapefiles".
1.- ¿QUÉ ES UNA BASE DE DATOS GEOGRÁFICA?
La esencia de un SIG está constituida por una base de datos geográfica. Esta es, una colección de datos acerca de objetos localizados en una determinada área de interés en la superficie de la tierra, organizados en una forma tal que puede servir eficientemente a una o varias aplicaciones. Una base de datos geográfica requiere de un conjunto de procedimientos que permitan hacer un mantenimiento de ella tanto desde el punto de vista de su documentación como de su administración. La eficiencia está determinada por los diferentes tipos de datos almacenados en diferentes estructuras. El vínculo entre las diferentes estructuras se obtiene mediante el campo clave que contiene el número identificador de los elementos. Tal número identificador aparece tanto en los atributos gráficos como en los no gráficos. Los atributos no gráficos son guardados en tablas y manipulados por medio de un sistema manejador de bases de datos.
Los atributos gráficos son guardados en archivos y manejados por el software de un sistema SIG. Los objetos geográficos son organizados por temas de información, o capas de información, llamadas también niveles. Aunque los puntos, líneas y polígonos pueden ser almacenados en niveles separados, lo que permite la agrupación de la información en temas son los atributos no gráficos. Los elementos simplemente son agrupados por lo que ellos representan. Así por ejemplo, en una categoría dada, ríos y carreteras aun siendo ambos objetos línea están almacenadas en distintos niveles por cuanto sus atributos son diferentes.
Los formatos estándar para un archivo de diseño son el formato celular o RASTER y el formato tipo VECTOR, en el primero de ellos se define una grilla o una malla de rectángulos o cuadrados a los que se les denomina células o retículas, cada retícula posee información alfanumérica asociada que representa las características de la zona o superficie geográfica que cubre, como ejemplos de este formato se pueden citar la salida de un proceso de fotografía satelital, la fotografía aérea es otro buen ejemplo.
De otro lado, el formato vectorial representa la información por medio de pares ordenados de coordenadas, este ordenamiento da lugar a las entidades universales con las que se representan los objetos gráficos, así: un punto se representa mediante un par de coordenadas, una línea con dos pares de coordenadas, un polígono como una serie de líneas y una área como un polígono cerrado. A las diversas entidades universales, se les puede asignar atributos y almacenar éstos en una base de datos descriptiva o alfanumérica para tales propósitos.
2. LA CONSTRUCCIÓN DE BASES DE DATOS GEOGRÁFICAS
La construcción de una base de datos geográfica implica un proceso de abstracción para pasar de la complejidad del mundo real a una representación simplificada asequible para el lenguaje de los ordenadores actuales. Este proceso de abstracción tiene diversos niveles -como iremos viendo- y normalmente comienza con la concepción de la estructura de la base de datos, generalmente en capas; en esta fase, y dependiendo de la utilidad que se vaya a dar a la información a compilar, se seleccionan las capas temáticas a incluir.
Pero la estructuración de la información espacial procedente del mundo real en capas conlleva cierto nivel de dificultad. En primer lugar, la necesidad de abstracción que requieren las máquinas implica trabajar con primitivas básicas de dibujo, de tal forma que toda la complejidad de la realidad ha de ser reducida a puntos, líneas o polígonos.
En segundo lugar, existen relaciones espaciales entre los objetos geográficos que el sistema no puede obviar; es lo que se denomina topología, que en realidad es el método matemático-lógico usado para definir las relaciones espaciales entre los objetos geográficos.
Aunque a nivel geográfico las relaciones entre los objetos son muy complejas, siendo muchos los elementos que interactúan sobre cada aspecto de la realidad, la topología de un S.I.G. reduce sus funciones a cuestiones mucho más sencillas, como por ejemplo conocer el polígono (o polígonos) a que pertenece una determinada línea, o bien saber qué agrupación de líneas forman una determinada carretera.
Existen diversas formas de modelizar estas relaciones entre los objetos geográficos o topología. Dependiendo de la forma en que ello se lleve a cabo se tiene uno u otro tipo de Sistema de Información Geográfica dentro de una estructura de tres grupos principales:
- S.I.G.
Vectoriales. |
No existe un modelo de datos que sea superior a otro, sino que cada uno tiene una utilidad específica, como veremos a continuación.
3. TOPOLOGÍAS, MODELOS DE DATOS Y TIPOS DE SIG
En función del modelo de datos implementado en cada sistema, podemos distinguir tres grandes grupos de Sistemas de Información Geográfica: SIG Vectoriales, SIG Raster y SIG con modelo de datos Orientados a Objetos. En realidad, la mayor parte de los sistemas existentes en la actualidad pertenecen a los dos primeros grupos (vectoriales y raster).
Aunque veremos posteriormente las diferencias entre ambos con más detalle, adelantaremos que los vectoriales utilizan vectores (básicamente líneas), para delimitar los objetos geográficos, mientras que los raster utilizan una retícula regular para documentar los elementos geográficos que tienen lugar en el espacio.
3.1. Los SIG Vectoriales
Son aquellos Sistemas de Información Geográfica que para la descripción de los objetos geográficos utilizan vectores definidos por pares de coordenadas relativas a algún sistema cartográfico.
Con un par de coordenadas y su altitud gestionan un punto (e.g. un vértice geodésico), con dos puntos generan una línea, y con una agrupación de líneas forman polígonos. De entre todos los métodos para formar topología vectorial la forma más robusta es la topología arco-nodo, cuya lógica de funcionamiento trataré de detallar en los siguientes esquemas:
La topología arco-nodo basa la estructuración de toda la información geográfica en pares de coordenadas, que son la entidad básica de información para este modelo de datos. Con pares de coordenadas (puntos) forma vértices y nodos, y con agrupaciones de éstos puntos forma líneas, con las que a su vez puede formar polígonos. Básicamente esta es la idea, muy sencilla en el fondo.
Para poder implementarla en un ordenador, se requiere la interconexión de varias bases de datos a través de identificadores comunes. Estas bases de datos, que podemos imaginarlas como tablas con datos ordenados de forma tabular, contienen columnas comunes a partir de las cuales se pueden relacionar datos no comunes entre una y otra tabla.
Hemos visto en el esquema anterior cómo se forman las líneas a partir de puntos (pares de coordenadas). Veámos ahora cómo se forman los polígonos a partir de la agrupación de líneas:
En general, el modelo de datos vectorial es adecuado cuando trabajamos con objetos geográficos con límites bien establecidos, como pueden ser fincas, carreteras, etc.
3.2. Los SIG Raster
Los Sistemas de Información Raster basan su funcionalidad en una concepción implícita de las relaciones de vecindad entre los objetos geográficos. Su forma de proceder es dividir la zona de afección de la base de datos en una retícula o malla regular de pequeñas celdas (a las que se denomina píxel) y atribuir un valor numérico a cada celda como representación de su valor temático. Dado que la malla es regular (el tamaño del píxel es constante) y que conocemos la posición en coordenadas del centro de una de las celdas, se puede decir que todos los píxeles están georreferenciados.
Lógicamente, para tener una descripción precisa de los objetos geográficos contenidos en la base de datos el tamaño del píxel ha de ser reducido (en función de la escala), lo que dotará a la malla de una resolución alta. Sin embargo, a mayor número de filas y columnas en la malla (más resolución), mayor esfuerzo en el proceso de captura de la información y mayor costo computacional a la hora de procesar la misma.
No obstante, el modelo de datos raster es especialmente útil cuando tenemos que describir objetos geográficos con límites difusos, como por ejemplo puede ser la dispersión de una nube de contaminantes, o los niveles de contaminación de un acuífero subterráneo, donde los contornos no son absolutamente nítidos; en esos casos, el modelo raster es más apropiado que el vectorial.
3.3. Los SIG Orientados a Objetos
No existe una definición clara ni un acuerdo general en la comunidad de usuarios acerca de la entidad de los modelos orientados a objetos, pero sí existe unanimidad en cuanto a las características que debe tener un S.I.G. de este tipo.
En primer lugar, los S.I.G. orientados a objetos plantean un cambio en la concepción de la estructura de las bases de datos geográficas; mientras los modelos de datos vectorial y raster estructuran su información mediante capas -como ya hemos dicho anteriormente- los sistemas orientados a objetos intentan organizar la información geográfica a partir del propio objeto geográfico y sus relaciones con otros. De este modo, los objetos geográficos están sometidos a una serie de procesos y se agrupan en clases entre las cuales se da la herencia.
En segundo lugar, los S.I.G. orientados a objetos introducen un carácter dinámico a la información incluida en el sistema, frente a los modelos de datos vectoriales y raster que tienen un carácter estático.
Por ello, el modelo orientado a objetos es más aconsejable para situaciones en las que la naturaleza de los objetos que tratamos de modelar es cambiante en el tiempo y/o en el espacio.
Para poner un ejemplo de organización de la información con este modelo de datos, pensemos en un sub compartimento forestal, dentro del cual se dan muchos árboles, cada uno de ellos sometido a unos procesos (por ejemplo el crecimiento); este crecimiento es heredado por el sub compartimento y da como resultado que la altura del mismo sea cambiante con el tiempo.
Por lo tanto, en este caso los atributos temáticos de cada objeto geográfico son el resultado de aplicar unas determinadas funciones que varían según las relaciones del objeto de referencia con su entorno.
Sin duda alguna, este modelo de datos es más aconsejable que cualquier otro para trabajar con datos geográficos, pero se encuentra con dificultades de implementación en los actuales Sistemas de Gestión de Bases de Datos (SGBD), y por lo tanto también con dificultades de implementación en los S.I.G. Hoy en día comienzan a verse implementaciones de este tipo de organización de datos en algunos GIS comerciales, si bien son a nuestro entender aproximaciones en cierto modo incompletas cuya su funcionalidad tiene que ser mejorada en los siguientes años.
La ventaja fundamental que permite esta estructura de datos frente a las demás es la dinamicidad de los datos. Es decir, a partir de una serie de parámetros establecidos en el comportamiento de los objetos geográficos, podemos simular su evolución futura, lo que constituye un gran avance si se trabaja en entornos en los que se requiere simulación de situaciones potenciales.