Hacia un nuevo concepto de bases de datos



 
 

¿Qué son las bases bases de datos?

Para explicar de una manera sencilla qué es una base de datos, podríamos decir que no es más que un almacén de datos y/o de información en soporte informático y buscable. Con frecuencia, el término "base de datos" sirve para hacer referencia tanto al almacén de información como al software que hace posible la gestión de la misma y la búsqueda.

En el momento actual, que podemos denominar era Internet, el concepto de base de datos ha experimentado ciertos cambios con respecto a la etapa pre-Internet. La definición de base de datos que en la década de los 80 hacía la Federación Internacional de Documentación (FID) como  "un conjunto de datos homogéneos, ordenados de una forma determinada, que se presenta normalmente en forma legible por ordenador (en cinta magnética u otro soporte) y se refieren a una organización, materia, o problema determinado" necesita hoy algunas matizaciones.

Las bases de datos, en la actualidad, podrían definirse como una colección de datos y/o documentos digitales, que pueden ser homogéneos o no, que disponen de sistemas de gestión de bases de datos (relacionales o documentales) y un conjunto de aplicaciones que hacen posible su publicación, integración y consulta dentro o fuera de Internet.

Sin embargo, Internet no solo nos ha traido gran cantidad de información que está disponible en la red sino además una nueva concepción de base de datos. En la actualidad existen:


En los servicios de directorios y motores de búsqueda existentes en Internet encontramos un buen ejemplo de este último tipo de bases de datos. Así, los motores de búsqueda (search engine) son programas o software que realizan búsquedas dentro de base de datos. Los servicios de directorios y motores de búsqueda que encontramos en Internet, como Altavista, Google y otros, son bases de datos de documentos y recursos web. Los robots, según el WWW Robots FAQ, son programas o software que atraviesan la estructura de documentos web extrayendo un documento y a partir de éste extrayendo todos los documentos que están referenciados por los enlaces. Mientras que los directorios o índices suelen ser recopilaciones manuales de documentos, que pueden mantenerse como directorio o bien ser introducidos en bases de datos para que sean buscables.


¿Para qué sirven?

Las bases de datos sirven para localizar datos e información de forma precisa y exhaustiva en el menor tiempo posible. Las bases de datos clásicas buscan información primaria que ha sido publicada en algún lugar. La base de datos se convierte en información secundaria. Sin embargo, las bases de datos formadas por archivos o documentos hipertextuales buscan los documentos en su forma original.

A los creadores de bases de datos se les ha venido llamando tradicionalmente productores o creadores de bases de datos. En la actualidad, Internet ha potenciado una nueva denominación: creadores de contenidos que engloba no sólo a los creadores de bases de datos clásicas sino a los creadores de cualquier tipo de información digital de mayor o menor calidad que añada valor.

El 22 de diciembre de 2000, los ministros de Telecomunicaciones de la Unión Europea aprobaron el Programa eContent para ayudar a estimular el desarrollo y el acceso de contenidos digitales europeos en Internet. Este programa que tendrá una vigencia de cinco años (2001-2004) y dotado con 17.500 millones de pesetas pretende acortar la ventaja en este campo con respecto a los Estados Unidos de América. Hoy, los contenidos digitales ocupan un lugar destacado en la nueva economía y ya dan empleo a 4 millones de personas en Europa. (El País 23/12/00 p.37)
 
 

¿Cuál es su objetivo?

Bases de datos clásicas:


Bases de datos formadas por archivos o documentos:

En este tipo de bases de datos, la calidad de la recuperación de la información depende de la composición de los índices. Destacan tres componentes importantes: cobertura, frecuencia de actualización y, en el caso de los documentos web, porción de página indexada (título, título y primeros párrafos, página completa, etiquetas meta)
 

Tipos de bases de datos

Desde el punto de vista de los sistemas de gestión que utiliza, las bases de datos pueden ser:

  1. Bases de datos relacionales
  2. Bases de datos documentales
  3. Bases de datos relacionales/documentales (sistemas híbridos)


Atendiendo al contenido:

  1. Bases de datos referenciales o bibliográficas
  2. Bases de datos numéricas
  3. Bases de datos de directorio
  4. Bases de datos a texto completo (full-text)
En la actualidad podemos apuntar además otra tipología de bases de datos como consecuencia de la popularización de Internet y de la web.

Atendiendo a la estructura de la información y la gestión de la misma:

Atendiendo a la forma de acceso:


Atendiendo a la forma de consulta:


 

¿Cómo se comercializan?

Las bases de datos se comercializan mediante:

  1. Disquete o disco óptico. La base de datos se empaqueta en un soporte físico transportable.
  2. Acceso remoto o acceso en línea. Se permite el acceso público de los usuarios a distancia. En la actualidad, la mayoría de las clásicas bases de datos accesibles en línea (Dialog, DataStar, BOE, ICEX, etc) proporcionan acceso a sus usuarios a través de Internet
  3. Acceso restringido a través de redes privadas. El acceso a las bases de datos creadas por las organizaciones para uso interno se hace a través de sus redes locales o de redes de telecomunicaciones privadas y de gran velocidad (Intranet y Extranet)
En el mercado existen miles de bases de datos de uso público, gratuitas y con cuotas de acceso. Gale Directory constituye una de las más antiguas y mejores recopilaciones  de bases de datos de acceso público. Con la llegada de Internet han aparecido otros directorios de bases de datos como Internet Invisible, que da acceso a más de 1000 bases de datos (mayoría españolas) gratuitas accesibles a través de Internet. La versión extranjera es The Invisible Web
 

¿Quiénes las distribuyen?

Los distribuidores de bases de datos (en inglés denominados host) son organizaciones públicas o privadas que albergan en sus ordenadores (servidores) un número importante de bases de datos construidas por distintos productores de bases de datos y a las que se puede acceder utilizando el mismo lenguaje de recuperación de información. Esta definición se asocia sobre todo a los grandes distribuidores de bases de datos como Dialog-DataStar, ESA-IRS, Echo, etc. En España, por ejemplo, la ausencia de un distribuidor de bases de datos ha sido una de las razones por las que la industria de bases de datos no ha experimentado un crecimiento significativo en la etapa pre-Internet.

Con la popularización de Internet muchos productores de bases de datos y creadores de contenidos digitales en general se han convertido en sus propios distribuidores. Han aparecido nuevas empresas dedicadas a comprar, vender y sindicar contenidos digitales, bases de datos, entre ellos.
 

Hasta hace unos pocos años, las bases de datos sólo podían utilizarse en el interior de las organizaciones, a través de redes locales o mediante conexión en línea previo contrato con el distribuidor de la base de datos. En la actualidad, la web ha permitido el acceso a las bases de datos desde cualquier parte del mundo. Hoy las bases de datos se pueden integrar en la web para ser consultadas a través de Internet. Para lograr la integración de las bases de datos en la web es necesario contar con una interfaz que haga las conexiones, extraiga la información de las bases de datos y les de el formato adecuado para que se puedan visualizar con el navegador.  (En los temas 16 y 17 trabajaremos con la integración de bases de datos)
 
 
 

 

 

Bibliografía
 

CODINA, Luís (1994) Modelo conceptual de un sistema de información documental. Revista Española de Documentación Científica, vol 17 nº 4. pp. 440-449

CODINA, Luís (1994) La naturaleza de la recuperación de la información : implicaciones para el diseño de sistemas de información documentales. IV Jornadas Españolas de Documentación Automatizada, DOCUMAT. pp. 433.441

MARTÍNEZ MÉNDEZ, Francisco Javier. Universidad de Murcia. Introducción a los Sistemas de Recuperación de información. En: http://www.um.es/gtiweb/fjmm/sarisite/tema1.html Visitado: 12/12/2000 (Consultar páginas 9 a 13)

MIGUEL, Adoración de y PIATTINI, Mario G. (1997) Fundamentos y modelos de bases de datos.Madrid: RA-MA, 1997.

VALLE GASTAMINZA, Félix del. Recuperación de datos y recuperación de documentos. Universidad Complutense de Madrid En: http://www.ucm.es/info/multidoc/prof/fvalle/Recdatrecdoc.htmVisitado: 09/12/2000

Guía Didáctica para la integración de BD en Internet En: http://www.uca.edu.sv/investigacion/bdweb/indice.html#contenidoVisitado: 20/11/2000



 

Conceptos: campo, registro y fichero inverso
 

Campo: lugar físico de almacenamiento destinado a contener información independiente.
  • Tipos de campos: alfabéticos, numéricos, alfanuméricos, de control.
  • Longitud de campo: número de posiciones que ocupa un campo en el destino de almacenamiento en el que está inserto. Puede ser igual o superior al número de caracteres del dato que contiene. Existen campos de longitud fija y campos de longitud variable.


Registro: conjunto de campos relacionados entre sí que contiene datos referidos a un mismo ente u objeto.

  • Tipos de campos según su función en el registro: literales, numéricos, claves, indicadores, códigos, punteros.
  • Registros de longitud fija: todos los campos que lo forman son de longitud fija.
  • Registros de longitud variable: uno o varios de los campos que lo integran tiene longitud variable aunque tiene una dimensión máxima que no se sobrepasará.
  • Registros de longitud indefinida: la longitud es imposible de determinar. Incluye marcas de final de campo y de fin de registro.
Ficheros indexados o ficheros inversos: ficheros que se crean para facilitar el acceso aleatorio mediante claves secundarias elegidas por el usuario. Cada registro contiene:
a) el valor del campo por el cual se desea realizar la búsqueda directa y b) un puntero, un registro de dirección que permite el acceso directo a dicho registro.