¿Qué son las bases bases de datos?
Para explicar de una manera sencilla qué es una base de datos, podríamos decir que no es más que un almacén de datos y/o de información en soporte informático y buscable. Con frecuencia, el término "base de datos" sirve para hacer referencia tanto al almacén de información como al software que hace posible la gestión de la misma y la búsqueda.
En el momento actual, que podemos denominar era Internet, el concepto de base de datos ha experimentado ciertos cambios con respecto a la etapa pre-Internet. La definición de base de datos que en la década de los 80 hacía la Federación Internacional de Documentación (FID) como "un conjunto de datos homogéneos, ordenados de una forma determinada, que se presenta normalmente en forma legible por ordenador (en cinta magnética u otro soporte) y se refieren a una organización, materia, o problema determinado" necesita hoy algunas matizaciones.
Las bases de datos, en la actualidad, podrían definirse como una colección de datos y/o documentos digitales, que pueden ser homogéneos o no, que disponen de sistemas de gestión de bases de datos (relacionales o documentales) y un conjunto de aplicaciones que hacen posible su publicación, integración y consulta dentro o fuera de Internet.
Sin embargo, Internet no solo nos ha traido gran cantidad de información que está disponible en la red sino además una nueva concepción de base de datos. En la actualidad existen:
Por eso, muchos sitios web con un volumen considerable de información han
incorporado un sistema de recuperación de información, que no es más que un
programa indizador (motor o robot) que se añade al servidor del web. El
programa indizador crea índices de palabras (ficheros inversos) que hacen
referencia a los documentos y permite al cliente web hacer consultas a
través de la base de datos que genera.
En los servicios de directorios y motores de búsqueda existentes en
Internet encontramos un buen ejemplo de este último tipo de bases de datos. Así,
los motores de búsqueda (search engine) son programas o software
que realizan búsquedas dentro de base de datos. Los servicios de directorios y
motores de búsqueda que encontramos en Internet, como Altavista, Google y otros, son bases de datos de
documentos y recursos web. Los robots, según el WWW Robots FAQ,
son programas o software que atraviesan la estructura de documentos web
extrayendo un documento y a partir de éste extrayendo todos los documentos que
están referenciados por los enlaces. Mientras que los directorios o
índices suelen ser recopilaciones manuales de documentos, que pueden
mantenerse como directorio o bien ser introducidos en bases de datos para que
sean buscables.
Las bases de datos sirven para localizar datos e información de forma precisa y exhaustiva en el menor tiempo posible. Las bases de datos clásicas buscan información primaria que ha sido publicada en algún lugar. La base de datos se convierte en información secundaria. Sin embargo, las bases de datos formadas por archivos o documentos hipertextuales buscan los documentos en su forma original.
A los creadores de bases de datos se les ha venido llamando tradicionalmente productores o creadores de bases de datos. En la actualidad, Internet ha potenciado una nueva denominación: creadores de contenidos que engloba no sólo a los creadores de bases de datos clásicas sino a los creadores de cualquier tipo de información digital de mayor o menor calidad que añada valor.
El 22 de diciembre de 2000, los ministros de Telecomunicaciones de la Unión
Europea aprobaron el Programa eContent para ayudar a estimular el
desarrollo y el acceso de contenidos digitales europeos en Internet. Este
programa que tendrá una vigencia de cinco años (2001-2004) y dotado con 17.500
millones de pesetas pretende acortar la ventaja en este campo con respecto a los
Estados Unidos de América. Hoy, los contenidos digitales ocupan un lugar
destacado en la nueva economía y ya dan empleo a 4 millones de personas en
Europa. (El País 23/12/00 p.37)
Bases de datos clásicas:
Bases de datos formadas por archivos o
documentos:
Desde el punto de vista de los sistemas de gestión que utiliza, las bases de datos pueden ser:
Atendiendo al contenido:
Atendiendo a la estructura de la información y la gestión de la misma:
Atendiendo a la forma de consulta:
Las bases de datos se comercializan mediante:
Los distribuidores de bases de datos (en inglés denominados host) son organizaciones públicas o privadas que albergan en sus ordenadores (servidores) un número importante de bases de datos construidas por distintos productores de bases de datos y a las que se puede acceder utilizando el mismo lenguaje de recuperación de información. Esta definición se asocia sobre todo a los grandes distribuidores de bases de datos como Dialog-DataStar, ESA-IRS, Echo, etc. En España, por ejemplo, la ausencia de un distribuidor de bases de datos ha sido una de las razones por las que la industria de bases de datos no ha experimentado un crecimiento significativo en la etapa pre-Internet.
Con la popularización de Internet muchos productores de bases de datos y
creadores de contenidos digitales en general se han convertido en sus propios
distribuidores. Han aparecido nuevas empresas dedicadas a comprar, vender y
sindicar contenidos digitales, bases de datos, entre ellos.
Hasta hace unos pocos años, las bases de datos sólo podían utilizarse en el
interior de las organizaciones, a través de redes locales o mediante conexión en
línea previo contrato con el distribuidor de la base de datos. En la actualidad,
la web ha permitido el acceso a las bases de datos desde cualquier parte del
mundo. Hoy las bases de datos se pueden integrar en la web para ser consultadas
a través de Internet. Para lograr la integración de las bases de datos en la web
es necesario contar con una interfaz que haga las conexiones, extraiga la
información de las bases de datos y les de el formato adecuado para que se
puedan visualizar con el navegador. (En los temas 16 y 17
trabajaremos con la integración de bases de datos)
CODINA, Luís (1994) Modelo conceptual de un sistema de información documental. Revista Española de Documentación Científica, vol 17 nº 4. pp. 440-449
CODINA, Luís (1994) La naturaleza de la recuperación de la información : implicaciones para el diseño de sistemas de información documentales. IV Jornadas Españolas de Documentación Automatizada, DOCUMAT. pp. 433.441
MARTÍNEZ MÉNDEZ, Francisco Javier. Universidad de Murcia. Introducción a los Sistemas de Recuperación de información. En: http://www.um.es/gtiweb/fjmm/sarisite/tema1.html Visitado: 12/12/2000 (Consultar páginas 9 a 13)
MIGUEL, Adoración de y PIATTINI, Mario G. (1997) Fundamentos y modelos de bases de datos.Madrid: RA-MA, 1997.
VALLE GASTAMINZA, Félix del. Recuperación de datos y recuperación de documentos. Universidad Complutense de Madrid En: http://www.ucm.es/info/multidoc/prof/fvalle/Recdatrecdoc.htmVisitado: 09/12/2000
Guía Didáctica para la integración de BD en Internet En: http://www.uca.edu.sv/investigacion/bdweb/indice.html#contenidoVisitado: 20/11/2000
Conceptos: campo, registro y fichero
inverso
Campo: lugar físico de almacenamiento destinado a contener información independiente.Ficheros indexados o ficheros inversos: ficheros que se crean para facilitar el acceso aleatorio mediante claves secundarias elegidas por el usuario. Cada registro contiene:
- Tipos de campos: alfabéticos, numéricos, alfanuméricos, de control.
- Longitud de campo: número de posiciones que ocupa un campo en el destino de almacenamiento en el que está inserto. Puede ser igual o superior al número de caracteres del dato que contiene. Existen campos de longitud fija y campos de longitud variable.
Registro: conjunto de campos relacionados entre sí que contiene datos referidos a un mismo ente u objeto.
- Tipos de campos según su función en el registro: literales, numéricos, claves, indicadores, códigos, punteros.
- Registros de longitud fija: todos los campos que lo forman son de longitud fija.
- Registros de longitud variable: uno o varios de los campos que lo integran tiene longitud variable aunque tiene una dimensión máxima que no se sobrepasará.
- Registros de longitud indefinida: la longitud es imposible de determinar. Incluye marcas de final de campo y de fin de registro.
a) el valor del campo por el cual se desea realizar la búsqueda directa y b) un puntero, un registro de dirección que permite el acceso directo a dicho registro.