Tema 1
Tema 1
Tema 1
¿Te has preguntado alguna vez dónde y de qué manera se almacenan y gestionan los datos
que utilizamos diariamente?.
Suponemos que no es necesario que continuemos más para darnos cuenta de que casi
todo lo que nos rodea, en alguna medida, está relacionado con los datos, su
almacenamiento y su gestión. El gran volumen de datos que actualmente manejamos y sus
innumerables posibilidades requieren de la existencia de técnicos perfectamente formados y
capaces de trabajar con ellos.
Este módulo profesional se centra en el estudio de las Bases de Datos y su uso en el
desarrollo de aplicaciones. En esta primera unidad comenzaremos conociendo los primeros
sistemas basados en ficheros para el almacenamiento y gestión de la información.
Seguidamente, se desarrollarán los conceptos y definiciones básicas relacionadas con las
bases de datos, posteriormente analizaremos sus modelos y tipos, un poco más adelante,
podremos conocer las características y capacidades de los sistemas gestores de bases de
datos y finalmente, identificaremos las herramientas reales con las que llevar a cabo la
gestión de dichas bases.
Juan le cuenta a María que hace poco visitó un museo en el que había una
exposición sobre historia de la informática y que pudo ver soportes antiguos para
almacenamiento de información: tarjetas perforadas, cintas magnéticas, tambores
magnéticos, discos de diferentes tamaños y otros dispositivos de la época.
2.1.- ¿Qué es un
fichero?
En la década de los setenta, los procesos básicos que se llevaban a cabo en una empresa
se centraban en cuestiones relacionadas con contabilidad y facturación. Las necesidades
de almacenamiento y gestión de información podían satisfacerse utilizando un número
relativamente reducido de archivos en papel agrupados y ordenados, los típicos ficheros
clásicos.
Al llevar a cabo una primera informatización, se pasó de tener los datos en formato papel a
poder acceder a ellos de manera mucho más rápida a través del ordenador. En ese
momento, la informática adaptó sus herramientas para que los elementos que el usuario
maneja en el ordenador se parezcan a los que utilizaba manualmente. Así en informática se
sigue hablado de ficheros, formularios, carpetas, directorios,...
La información debía ser trasladada desde el papel al formato digital y por lo general, era
necesario almacenarla para su posterior recuperación, consulta y procesamiento. De este
modo, para llevar a cabo un tratamiento eficiente de ésta era necesario establecer métodos
adecuados para su almacenamiento. El elemento que permitió llevar a cabo el
almacenamiento de datos de forma permanente en dispositivos de memoria masiva fue el
fichero o archivo.
Fichero o archivo: conjunto de información relacionada, tratada como un todo y
organizada de forma estructurada. Es una secuencia de dígitos binarios que organiza
información relacionada con un mismo aspecto.
Los ficheros están formados por registros lógicos que contienen datos relativos a un
mismo elemento u objeto (por ejemplo, los datos de usuarios de una plataforma educativa).
A su vez, los registros están divididos en campos que contienen cada una de las
informaciones elementales que forman un registro (por ejemplo, el nombre del usuario o su
dirección de correo electrónico).
Hemos de resaltar que los datos están almacenados de tal forma que se puedan añadir,
suprimir, actualizar o consultar individualmente en cualquier momento.
Como los ficheros suelen ser muy voluminosos, solo se pueden llevar a la memoria principal
partes de ellos para poder procesarlos. La cantidad de información que es transferida entre
el soporte en el que se almacena el fichero, y la memoria principal del ordenador, en una
sola operación de lectura/grabación, recibe el nombre de registro físico o bloque.
2.2.- Tipos de
ficheros.
Según la función que vaya a desempeñar los ficheros, éstos pueden ser clasificados de
varias maneras. En la siguiente imagen puedes observar una posible clasificación.
Autoevaluación
Supongamos una aplicación informática para gestionar una biblioteca,
existirá un fichero con el catálogo de libros disponibles, otro con las
editoriales, otro con información sobre libros que se han quedado obsoletos,
etc. ¿A cuál de los siguientes tipos correspondería el fichero que almacena
las editoriales?
Fichero maestro.
Fichero constante.
Fichero intermedio.
● Soportes de Acceso Directo a los datos (Por ejemplo: discos). Son los más
empleados y el acceso a los datos puede hacerse de forma directa, pudiendo
colocarnos en la posición que nos interesa y leer a partir de ella.
● Soportes de Acceso Secuencial (Por ejemplo: cintas magnéticas). Se suelen usar
en copias de seguridad y si deseamos leer un dato que está en la mitad de la cinta,
tendremos que leer todo lo que hay hasta llegar a esa posición.
2.4.- Métodos de
acceso.
Autoevaluación
Relaciona los diferentes métodos de acceso a los ficheros.
Encadenado 1. Directo.
.
Indexado. 2. Secuencial.
Calculado o 3. Directo o
Hash. secuencial.
2.5.- Ficheros
secuenciales.
Un fichero con organización secuencial se caracteriza porque sus registros están
almacenados de forma contigua, de manera, que la única forma de acceder a él, es leyendo
un registro tras otro desde el principio hasta el final. En los ficheros secuenciales suele
haber una marca indicativa del fin del fichero, que suele denominarse EOF (End of File).
Para detectar el final del fichero sólo es necesario encontrar la marca EOF.
Los registros almacenados se identifican por medio de una información ubicada en uno de
sus campos, a este campo se le denomina clave o llave. Si se ordena un archivo
secuencial por su clave, es más rápido realizar cualquier operación de lectura o escritura.
2.6.- Ficheros de
acceso directo.
En este tipo de ficheros se puede acceder a un registro indicando la posición relativa del
mismo dentro del archivo o, más comúnmente, a través de una clave que forma parte del
registro como un campo más. Estos archivos deben almacenarse en dispositivos de
memoria masiva de acceso directo, como son los discos magnéticos.
Campo clave: campo que permite identificar y localizar un registro de manera ágil y
organizada.
Cada uno de los registros se guarda en una posición física, que dependerá del espacio
disponible en memoria masiva, de ahí que la distribución de los registros sea aleatoria
dentro del soporte de almacenamiento. Para acceder a la posición física de un registro se
utiliza una dirección o índice, no siendo necesario recorrer todo el fichero para encontrar un
determinado registro.
● Posicionamiento inmediato.
● Registros de longitud fija.
● Apertura del fichero en modo mixto, para lectura y escritura.
● Permiten múltiples usuarios utilizándolos.
● Los registros se borran colocando un cero en la posición que ocupan.
● Permiten la utilización de algoritmos de compactación de huecos.
● Los archivos se crean con un tamaño definido, es decir, con un máximo de registros
establecido durante la creación.
● Esta organización sólo es posible en soportes direccionables.
● Se usan cuando el acceso a los datos de un registro se hace siempre empleando la
misma clave y la velocidad de acceso a un registro es lo que más nos importa.
● Permiten la actualización de los registros en el mismo fichero, sin necesidad de
copiar el fichero.
● Permiten realizar procesos de actualización en tiempo real.
Autoevaluación
En los ficheros de acceso directo los registros siempre se encuentran en
posiciones contiguas dentro del soporte de almacenamiento.
Verdadero Falso
2.7.- Ficheros
indexados.
Se basan en la utilización de índices, que permiten el acceso a un registro del fichero de
forma directa, sin tener que leer los anteriores. Estos índices son similares a los de los
libros. Si nos interesa leer un capítulo concreto podemos recurrir al índice que nos dice en
que página comienza, y abrimos el libro por esa página, sin tener que mirar en todas las
páginas anteriores para localizarlo.
Por tanto, existirá una zona de registros en la que se encuentran los datos del archivo y
una zona de índices, que contiene una tabla con las claves de los registros y las posiciones
donde se encuentran los mismos. La tabla de índices estará ordenada por el campo clave.
La tabla de índices será cargada en memoria principal para realizar en ella la búsqueda de
la fila correspondiente a la clave del registro a encontrar, obteniéndose así la dirección
donde se encuentra el registro. Una vez localizada la dirección, sólo hay que acceder a la
zona de registros en el soporte de almacenamiento y posicionarnos en la dirección indicada.
Puesto que la tabla debe prever la inclusión de todas las direcciones posibles del archivo,
su principal inconveniente resulta determinar su tamaño y mantenerla ordenada por los
valores de la clave.
● El diseño del registro tiene que tener un campo, o combinación de campos, que
permita identificar cada registro de forma única, es decir, que no pueda haber dos
registros que tengan la misma información en él. A este campo se le llama campo
clave y es el que va a servir de índice. Un mismo fichero puede tener mas de un
campo clave, pero al menos uno de ellos no admitirá valores duplicados y se le
llama clave primaria. A las restantes se les llama claves alternativas.
● Permiten utilizar el modo de acceso secuencial y el modo de acceso directo para
leer la información guardada en sus registros.
● Para acceder a este tipo de ficheros utilizando el modo de acceso directo se hace
conociendo el contenido del campo clave del registro que queremos localizar. Con
esa información el sistema operativo puede consultar el índice y conocer la posición
del registro dentro del fichero.
● Para acceder a este tipo de ficheros utilizando el modo de acceso secuencial los
registros son leídos ordenados por el contenido del campo clave,
independientemente del orden en que se fueron grabando (el orden lógico no es
igual al orden físico), debido a que el acceso a los datos se hace a través del índice,
que para hacer más fácil la búsqueda de los registros, permanece siempre ordenado
por el campo clave.
● Solamente se puede grabar en un soporte direccionable. Por ejemplo, un disco
magnético. Si esto no fuera así, no podría emplear el acceso directo.
2.8.- Otros
(secuenciales
indexados, hash.).
En la tabla de índices, cada fila hace referencia a cada uno de los segmentos. La clave
corresponde al último registro y el índice apunta al registro inicial. Una vez que se accede al
primer registro del segmento, dentro de él se localiza (de forma secuencial) el registro
buscado.
Esta organización es muy utilizada, tanto para procesos en los que intervienen pocos
registros como para aquellos en los que se maneja el fichero completo.
El mayor problema que presenta este tipo de ficheros es que a partir de diferentes claves se
obtenga la misma dirección al aplicar la función matemática o transformación. A este
problema se le denomina colisión, y las claves que generan la misma dirección se conocen
por sinónimos. Para resolver este problema se aplican diferentes métodos, como tener un
bloque de excedentes o zona de sinónimos, o crear un archivo de sinónimos, etc.
Una buena transformación o función de hash, será aquella que produzca el menor número
de colisiones. En este caso hay que buscar una función, a ser posible biunívoca, que
relacione los posibles valores de la clave con el conjunto de números correlativos de
dirección. Esta función consistirá en realizar una serie de cálculos matemáticos con el valor
de la clave hasta obtener un número entre 1 y n, siendo n el número de direcciones que
tiene el fichero.
Autoevaluación
En un fichero con acceso calculado:
Hay una tabla en la que está cada clave con la dirección del registro
correspondiente.
2.9.- Parámetros de
utilización.
En función del uso que se vaya a dar al fichero, serán adecuados unos tipos u otros de
organización. Mediante la utilización de parámetros de referencia , podremos determinar
el uso de un fichero. Estos parámetros son:
Autoevaluación
La volatilidad de un fichero es un parámetro que indica:
Ada, Juan y María, se han reunido para aclarar ideas sobre qué sistema de
gestión de información van a utilizar.
-Bases de datos, está claro. Pero, hay de varios tipos ¿no? -pregunta Juan.
Ada, asiente con la cabeza y confirma a sus dos compañeros que la práctica
totalidad de los sistemas de información actuales utilizan acceso a bases de datos.
Continúa Ada: -Sé que todos conocemos lo que son las bases de datos, pero es
necesario afianzar y aclarar muchos conceptos fundamentales que nos van hacer
falta para plantear, diseñar y construir las bases de datos que nuestras
aplicaciones utilizarán.
Como hemos visto anteriormente, los ficheros permiten organizar y memorizar conjuntos de
datos del mismo tipo o naturaleza con una determinada estructura, siendo un medio para el
almacenamiento de los datos o resultados de una aplicación específica. Pero si las
aplicaciones, al ser diseñadas, deben depender directamente de sus ficheros o archivos, se
pierde independencia y surgen serios inconvenientes: como información duplicada,
incoherencia de datos, fallos de seguridad, etc.
Conocer los sistemas que gestionan las bases de datos, sus conceptos fundamentales, el
diseño, lenguajes y la implementación de éstas, podemos considerarlo imprescindible para
alguien que se está formando en el campo de la informática.
3.1.- Conceptos.
A finales de los setenta, la aparición de nuevas tecnologías de manejo de datos a través de
los sistemas de bases de datos supuso un considerable cambio. Los sistemas basados en
ficheros separados dieron paso a la utilización de sistemas gestores de bases de datos, que
son sistemas software centralizados o distribuidos que ofrecen facilidades para la definición
de bases de datos, selección de estructuras de datos y búsqueda de forma interactiva o
mediante lenguajes de programación.
Base de datos: Es una colección de datos relacionados lógicamente entre sí, con una
definición y descripción comunes y que están estructurados de una determinada
manera. Es un conjunto estructurado de datos que representa entidades y sus
interrelaciones, almacenados con la mínima redundancia y posibilitando el acceso a
ellos eficientemente por parte de varias aplicaciones y usuarios.
La base de datos no sólo contiene los datos de la organización, también almacena una
descripción de dichos datos. Esta descripción es lo que se denomina metadatos, se
almacena en el diccionario de datos o catálogo y es lo que permite que exista
independencia de datos lógica-física.
Autoevaluación
Una base de datos es:
Conjunto de datos de distinto tipo relacionados entre sí, junto con un programa de
gestión de dichos datos.
3.2.- Usos.
Stockbyte (CC BY-NC-SA)
Ya sabemos qué es una base de datos y sus características principales, pero es necesario
conocer quien las usa y para qué.
Existen cuatro tipos de personas que pueden hacer uso de una base de datos: el
administrador, los diseñadores de la base de datos, los programadores de aplicaciones y los
usuarios finales.
Los diseñadores Son las personas encargadas de diseñar cómo será la base de
datos. Llevarán a cabo la identificación de los datos, las relaciones
entre ellos, sus restricciones, etc. Para ello han de conocer a fondo
los datos y procesos a representar en la base de datos. Si
estamos hablando de una empresa, será necesario que conozcan
las reglas de negocio en la que esta se mueve. Para obtener un
buen resultado, el diseñador de la base de datos debe implicar en
el proceso a todos los usuarios de la base de datos, tan pronto
como sea posible.
Los Una vez diseñada y construida la base de datos, los
programadores programadores se encargarán de implementar los programas de
de aplicaciones aplicación que servirán a los usuarios finales. Estos programas de
aplicación ofrecerán la posibilidad de realizar consultas de datos,
inserción, actualización o eliminación de los mismos. Para
desarrollar estos programas se utilizan lenguajes de tercera o
cuarta generación.
Enumerar todos y cada uno de los campos donde se utilizan las bases de datos es
complejo, aunque seguro que quedarán muchos en el tintero, a continuación se recopilan
algunos de los ámbitos donde se aplican.
3.3.- Ubicación de la
información.
Utilizamos a diario las bases de datos, pero ¿dónde se encuentra realmente almacenada la
información?. Las bases de datos pueden tener un tamaño muy reducido (1 MegaByte o
menos) o bien, ser muy voluminosas y complejas (del orden de Terabytes). Sin embargo
todas las bases de datos normalmente se almacenan y localizan en discos duros y otros
dispositivos de almacenamiento, a los que se accede a través de un ordenador. Una gran
base de datos puede necesitar servidores en lugares diferentes, y viceversa, pequeñas
bases de datos pueden existir como archivos en el disco duro de un único equipo.
Sistemas RAID.
Sistemas NAS.
Sistemas SAN.
Autoevaluación
Rellena los huecos con los conceptos adecuados.
.
4.- Modelos de
bases de datos.
Caso práctico
María ve como Ada, algo escéptica al respecto, aclara a Juan algunas ideas:
-Juan, la experiencia es un grado como siempre hemos destacado, pero es
imprescindible conocer y dominar los conceptos más importantes sobre bases de
datos. Al igual que comenzar a programar directamente codificando, implementar
una base de datos directamente sin detenerse a realizar un análisis previo y
emplear las herramientas adecuadas, puede provocar muchos quebraderos de
cabeza.
Ada indica a María: -Las bases de datos no siempre han sido como las conocemos
ahora, han habido diferentes modelos para su construcción y es bueno conocer la
evolución de éstos para comprender por qué utilizaremos el modelo de bases de
datos relacional.
La clasificación tradicional de las bases de datos establece tres modelos de bases de datos:
jerárquico, en red y relacional. En la actualidad el modelo de bases de datos más extendido
es el relacional. Aunque, hay que tener en cuenta que dos de sus variantes (modelo de
bases de datos distribuidas y orientadas a objetos) son las que se más se están utilizando
en los últimos tiempos.
En los siguientes epígrafes analizaremos cada uno de ellos, así como otros modelos de
bases de datos existentes.
Debes conocer
Conoce las características generales y graba en tu memoria fotográfica los gráficos
que representan a cada uno de los modelos expuestos en el siguiente artículo:
4.1.- Modelo
jerárquico.
Cuando IBM creó su Sistema Administrador de Información o IMS, se establecieron las
bases para que la gran mayoría de sistemas de gestión de información de los años setenta
utilizaran el modelo jerárquico. También recibe el nombre de modelo en árbol, ya que utiliza
una estructura en árbol invertido para la organización de los datos.
La información se organiza con un jerarquía en la que la relación entre las entidades de este
modelo siempre es del tipo padre/hijo. De tal manera que existen nodos que contienen
atributos o campos y que se relacionarán con sus nodos hijos, pudiendo tener cada nodo
más de un hijo, pero un nodo siempre tendrá un sólo padre.
Los datos de este modelo se almacenan en estructuras lógicas llamadas segmentos. Los
segmentos se relacionan entre sí utilizando arcos. La forma visual de este modelo es de
árbol invertido, en la parte superior están los padres y en la inferior los hijos.
Hoy en día, debido a sus limitaciones, el modelo jerárquico está en desuso. En el siguiente
gráfico puedes observar la estructura de almacenamiento del modelo jerárquico.
Ministerio de Educación (CC BY-NC)
El modelo jerárquico.
El enfoque jerárquico.
Autoevaluación
Rellena los huecos con los conceptos adecuados.
, de manera que un
En este modelo se pueden representar perfectamente cualquier tipo de relación entre los
datos, pero hace muy complicado su manejo. Al no tener que duplicar la información se
ahorra espacio de almacenamiento.
El modelo en red.
El enfoque en red.
4.3- Modelo
relacional.
Este modelo es posterior a los dos anteriores y fue desarrollado por Codd en 1970. Hoy en
día las bases de datos relacionales son las más utilizadas.
Se llamará registro, entidad o tupla a cada fila de la tabla y campo o atributo a cada
columna de la tabla.
Una clave será un atributo o conjunto de atributos que identifique de forma única a una
tupla.
A continuación puedes observar cómo es una relación con sus tuplas y atributos en el
modelo relacional.
Ministerio de Educación (CC BY-NC)
El lenguaje habitual para construir las consultas a bases de datos relacionales es SQL,
Structured Query Language o Lenguaje Estructurado de Consultas, un estándar
implementado por los principales motores o sistemas de gestión de bases de datos
relacionales.
Durante su diseño, una base de datos relacional pasa por un proceso al que se conoce
como normalización de una base de datos.
El modelo relacional.
Autoevaluación
Rellena los huecos con los conceptos adecuados.
La
de bases de datos relacional consiste en definir las reglas que determinan las
dependencias entre los datos de una base de datos relacional. Si definimos esta
relación o dependencia entre los elementos de una determinada base de datos de
la manera más sencilla posible, conseguiremos que la cantidad de espacio
necesario para guardar los datos sea el menor posible y la facilidad para actualizar
la relación sea la mayor posible asegurando la coherencia de la información. Es
decir, optimizaremos su funcionamiento.
4.4.- Modelo
orientado a objetos.
El modelo orientado a objetos define una base de datos en términos de objetos, sus
propiedades y sus operaciones. Los objetos con la misma estructura y comportamiento
pertenecen a una clase, y las clases se organizan en jerarquías. Las operaciones de cada
clase se especifican en términos de procedimientos predefinidos denominados métodos.
Algunos sistemas existentes en el mercado, basados en el modelo relacional, han sufrido
evoluciones incorporando conceptos orientados a objetos. A estos modelos se les conoce
como sistemas objeto-relacionales.
El objetivo del modelo orientado a objetos es cubrir las limitaciones del modelo relacional.
Gracias a este modelo se incorporan mejoras como la herencia entre tablas, los tipos
definidos por el usuario, soporte multimedia, etc.
Los conceptos más importantes del paradigma de objetos que el modelo orientado a objetos
incorpora son:
a. Modelo Objeto-Relacional
Las bases de datos pertenecientes a este modelo, son un híbrido entre las bases del
modelo relacional y el orientado a objetos. El mayor inconveniente de las bases de
datos orientadas a objetos radica en los costes de la conversión de las bases de
datos relacionales a bases de datos orientadas a objetos.
En una base de datos objeto-relacional (BDOR) siempre se busca obtener lo mejor
del modelo relacional, incorporando las mejoras ofrecidas por la orientación a
objetos. En este modelo se siguen almacenando tuplas, aunque la estructura de las
tuplas no está restringida sino que las relaciones pueden ser definidas en función de
otras, que es lo que denominamos herencia directa.
El estándar en el que se basa este modelo es SQL99. Este estándar ofrece la
posibilidad de añadir a las bases de datos relacionales procedimientos almacenados
de usuario, triggers, tipos definidos por el usuario, consultas recursivas, bases de
datos OLAP, tipos LOB, ...
Otra característica a destacar es la capacidad para incorporar funciones que tengan
un código en algún lenguaje de programación como por ejemplo: SQL, Java, C, etc.
La gran mayoría de las bases de datos relacionales clásicas de gran tamaño, como
Oracle, SQL Server, etc., son objeto-relacionales.
b. Modelo de bases de datos deductivas
En este modelo las bases de datos almacenan la información y permiten realizar
deducciones a través de inferencias. Es decir, se derivan nuevas informaciones a
partir de las que se han introducido explícitamente en la base de datos por parte del
usuario.
Las bases de datos deductivas son también llamadas bases de datos lógicas, al
basarse en lógica matemática. Surgieron para contrarrestar las limitaciones del
modelo relacional para la respuesta a consultas recursivas y la deducción de
relaciones indirectas entre los datos almacenados.
María pregunta a Ada: ─Si nuestras aplicaciones van a ser accesibles desde
Internet ¿Qué tipo de base de datos utilizaremos?
Como hemos visto, por cada modelo de datos se establecen sustanciales diferencias entre
unas bases de datos y otras, pero, ¿Esta es la única clasificación de las bases de datos
existente? No, vamos a ver a continuación una detallada descripción de los tipos de bases
de datos teniendo en cuenta varios criterios.
Debes conocer
Accede a través del siguiente documento una completa clasificación de las bases
de datos, teniendo en cuenta diferentes puntos de vista, podrás conocer la gran
variedad de tipos que existen.
Bases de datos
según su contenido
◄
1
2
3
4
5
6
7
►
Autoevaluación
Las bases de datos en las que sus registros no contienen el texto original
sino tan sólo la información fundamental para describir y permitir la
localización de documentos impresos, sonoros, iconográficos, audiovisuales
o electrónicos, reciben el nombre de:
Ada explica a Juan y María que la elección de un buen Sistema Gestor de Base
de Datos es fundamental. A través de esta herramienta podrán definir, construir y
manejar las bases de datos con las que sus aplicaciones informáticas han de
trabajar. Conocer sus funciones, componentes y tipos será la base fundamental
para llevar a cabo una elección adecuada.
Juan dice: -Yo he utilizado varios sistemas gestores diferentes, cada uno tiene sus
ventajas e inconvenientes, pero en general todos se parecen un poco. Eso sí,
facilitan mucho el trabajo, son fiables y ahorran tiempo.
Para poder tratar la información contenida en las bases de datos se utilizan los sistemas
gestores de bases de datos o SGBD, también llamados DBMS (DataBase Management
System), que ofrecen un conjunto de programas que permiten acceder y gestionar dichos
datos.
El objetivo fundamental de los SGBD es proporcionar eficiencia y seguridad a la hora de
recuperar o insertar información en las bases de datos. Estos sistemas están diseñados
para la manipulación de grandes bloques de información.
6.1.- Funciones.
Un SGBD desarrolla tres funciones fundamentales: descripción, manipulación y control o
utilización de los datos.
Se especificarán las características de los datos a cada uno de los tres niveles y el SGBD
se ocupará de la transformación de las estructuras externas orientadas a los usuarios a las
estructuras conceptuales y de la relación de ésta y la estructura física..
A nivel externo (estructura externa), se deben definir las vistas de los distintos usuarios a
través del lenguaje para la definición de estructuras externas.
¿Y a través de qué lenguaje podremos desarrollar estas funciones sobre la base de datos?
Lo haremos utilizando el Lenguaje Estructurado de Consultas ( SQL: Structured Query
Language). Este lenguaje proporciona sentencias para realizar operaciones de DDL, DML y
DCL. SQL fue publicado por el ANSI en 1986 (American National Standard Institute) y ha
ido evolucionando a lo largo del tiempo. Además, los SGBD suelen proporcionar otras
herramientas que complementan a estos lenguajes como generadores de formularios,
informes, interfaces gráficas, generadores de aplicaciones, etc.
Autoevaluación
El DDL de una base de datos sirve para:
6.2.- Componentes.
Una vez descritas las funciones que un SGBD debe llevar a cabo, imaginarás que un SGBD
es un paquete de software complejo que ha de proporcionar servicios relacionados con el
almacenamiento y la explotación de los datos de forma eficiente. Para ello, cuenta con una
serie de componentes que se detallan a continuación:
5. Rion (CC BY )
6. Usuarios de la base de datos. En los SGBD existen diferentes perfiles de usuario,
cada uno de ellos con una serie de permisos sobre los objetos de la BD.
Generalmente existirán:
○ El administrador de la base de datos o Database Administrator ( DBA), que
será la persona o conjunto de ellas encargadas de la función de
administración de la base de datos. Tiene el control centralizado de la base
de datos y es el responsable de su buen funcionamiento. Es el encargado de
autorizar el acceso a la base de datos, de coordinar y vigilar su utilización y
de adquirir los recursos software y hardware que sean necesarios.
○ Los usuarios de la base de datos, que serán diferentes usuarios de la BD
con diferentes necesidades sobre los datos, así como diferentes accesos y
privilegios. Podemos establecer la siguiente clasificación:
■ Diseñadores.
■ Operadores y personal de mantenimiento.
■ Analistas y programadores de aplicaciones.
■ Usuarios finales: ocasionales, simples, avanzados y autónomos.
7. Herramientas de la base de datos. Son un conjunto de aplicaciones que permiten
a los administradores la gestión de la base de datos, de los usuarios y permisos,
generadores de formularios, informes, interfaces gráficas, generadores de
aplicaciones, etc.
6.3.- Arquitectura.
Un SGBD cuenta con una arquitectura a través de la que se simplifica a los diferentes
usuarios de la base de datos su labor. El objetivo fundamental es separar los programas de
aplicación de la base de datos física.
Encontrar un estándar para esta arquitectura no es una tarea sencilla, aunque los tres
estándares que más importancia han cobrado en el campo de las bases de datos son
ANSI/SPARC/X3, CODASYL y ODMG (éste sólo para las bases de datos orientadas a
objetos). Tanto ANSI (EEUU), como ISO (Resto del mundo), son el referente en cuanto a
estandarización de bases de datos, conformando un único modelo de bases de datos.
Para una base de datos, sólo existirá un único esquema interno, un único esquema
conceptual y podrían existir varios esquemas externos definidos para uno o varios usuarios.
Autoevaluación
El esquema conceptual de la totalidad de la base de datos puede obtenerse
de la unión de todos los esquemas externos definidos para cada usuario de
la base de datos.
Verdadero Falso
6.4.- Tipos.
¿Qué tipos de SGBD existen? Para responder a esta pregunta podemos realizar la
siguiente clasificación, atendiendo a diferentes criterios:
a. Según el modelo lógico en que se basan. Actualmente, el modelo lógico que más
se utiliza es el relacional. Los modelos en red y jerárquico han quedado obsoletos.
Otro de los modelos que más extensión está teniendo es el modelo orientado a
objetos. Por tanto, en esta primera clasificación tendremos:
○ Modelo Jerárquico.
○ Modelo de Red.
○ Modelo Relacional.
○ Modelo Orientado a Objetos.
b. (Para recordar los modelos de bases de datos vistos, sitúate en el epígrafe 4 de esta
Unidad de Trabajo y analiza su contenido.)
c. Según el número de usuarios a los que da servicio el sistema:
○ Monousuario: sólo atienden a un usuario a la vez, y su principal uso se da
en los ordenadores personales.
○ Multiusuario: entre los que se encuentran la mayor parte de los SGBD,
atienden a varios usuarios al mismo tiempo.
d. Según el número de sitios en los que está distribuida la base de datos:
○ Centralizados: sus datos se almacenan en un solo computador. Los SGBD
centralizados pueden atender a varios usuarios, pero el SGBD y la base de
datos en sí residen por completo en una sola máquina.
○ Distribuidos (Homogéneos, Heterogéneos): la base de datos real y el
propio software del SGBD pueden estar distribuidos en varios sitios
conectados por una red. Los sistemas homogéneos utilizan el mismo SGBD
en múltiples sitios. Una tendencia reciente consiste en crear software para
tener acceso a varias bases de datos autónomas preexistentes almacenadas
en sistemas distribuidos heterogéneos. Esto da lugar a los SGBD federados
o sistemas multibase de datos en los que los SGBD participantes tienen
cierto grado de autonomía local.
e. Según el coste. La mayor parte de los paquetes cuestan entre 10.000 y 100.000
euros. Los sistemas monousuario más económicos para microcomputadores
cuestan entre 0 y 3.000 euros. En el otro extremo, los paquetes más completos
cuestan más de 100.000 euros.
f. Según el propósito o finalidad:
○ Propósito General: pueden ser utilizados para el tratamiento de cualquier
tipo de base de datos y aplicación.
○ Propósito Específico: Cuando el rendimiento es fundamental, se puede
diseñar y construir un software de propósito especial para una aplicación
específica, y este sistema no sirve para otras aplicaciones. Muchos sistemas
de reservas de líneas aéreas son de propósito especial y pertenecen a la
categoría de sistemas de procesamiento de transacciones en línea, que
deben atender un gran número de transacciones concurrentes sin imponer
excesivos retrasos.
7.- SGBD
comerciales.
Caso práctico
A través de la siguiente tabla se exponen los SGBD comerciales más utilizados y sus
características más relevantes:
MYSQL Sistema muy extendido que se ofrece bajo dos tipos de MySQL
licencia, comercial o libre. Para aquellas empresas que
deseen incorporarlo en productos privativos, deben
comprar una licencia específica. Es Relacional, Multihilo,
Multiusuario y Multiplataforma. Su gran velocidad lo hace
ideal para consulta de bases de datos y plataformas web.
Juan, que tiene especial debilidad por el software libre, comenta que existen
alternativas muy potentes a coste cero. Ada, agradece la información que Juan
aporta e indica que también tendrán en cuenta los sistemas gestores de bases de
datos libres en sus desarrollos, ya que algunos de ellos están ampliamente
extendidos y ofrecen importantes ventajas. María, que ha trabajado alguna vez con
MySQL, está deseosa de aprender nuevos sistemas gestores ya sean comerciales
o libres.
Autoevaluación
El tamaño máximo de una tabla en PostGreSQL es de 1,6 Terabytes.
Verdadero Falso
Los tres continúan su visita, analizando las ventajas e inconvenientes del sistema
centralizado que están viendo.
Los sistemas de los años sesenta y setenta eran totalmente centralizados, como
corresponde a los sistemas operativos de aquellos años, y al hardware para el que estaban
hechos: un gran ordenador para toda la empresa y una red de terminales sin inteligencia ni
memoria.
Ventajas Inconvenientes
Ventajas Inconvenientes
Desde una ubicación puede accederse a Existe una complejidad añadida que es
información alojada en diferentes necesaria para garantizar la coordinación
lugares. apropiada entre los nodos.
Los costes son inferiores a los de las La inversión inicial es menor, pero el
bases centralizadas. mantenimiento y control puede resultar
costoso.
Existe cierta tolerancia a fallos. Mediante Dado que los datos pueden estar
la replicación, si un nodo deja de replicados, el control de concurrencia y los
funcionar el sistema completo no deja de mecanismos de recuperación son mucho
funcionar. más complejos que en un sistema
centralizado.
El enfoque distribuido de las bases de El intercambio de mensajes y el cómputo
datos se adapta más naturalmente a la adicional necesario para conseguir la
estructura de las organizaciones. coordinación entre los distintos nodos
Permiten la incorporación de nodos de constituyen una forma de sobrecarga que
forma flexible y fácil. no surge en los sistemas centralizados.
10.1.-
Fragmentación.
Pero hay que tener en cuenta el grado de fragmentación que se aplicará, ya que éste es
un factor determinamente a la hora de la ejecución de consultas. Si no existe fragmentación,
se tomarán las relaciones o tablas como la unidad de fragmentación. Pero también puede
fragmentarse a nivel de tupla (fila o registro) o a nivel de atributo (columna o campo) de una
tabla. No será adecuado un grado de fragmentación nulo, ni tampoco un grado de
fragmentación demasiado alto. El grado de fragmentación deberá estar equilibrado y
dependerá de las particularidades de las aplicaciones que utilicen dicha base de datos.
Concretando, el objetivo de la fragmentación es encontrar un nivel de particionamiento
adecuado en el rango que va desde tuplas o atributos hasta relaciones completas.
Cuando se lleva a cabo una fragmentación, existen tres reglas fundamentales a cumplir:
● Completitud. Si una relación R se descompone en fragmentos R1, R2, ..., Rn, cada
elemento de datos que pueda encontrarse en R deberá poder encontrarse en uno o
varios fragmentos Ri.
● Reconstrucción. Si una relación R se descompone en una serie de fragmentos R1,
R2, ..., Rn, la reconstrucción de la relación a partir de sus fragmentos asegura que
se preservan las restricciones definidas sobre los datos.
● Disyunción. Si una relación R se descompone verticalmente, sus atributos primarios
clave normalmente se repiten en todos sus fragmentos.
Autoevaluación
Una base de datos almacenada entre distintos computadores conectados en
red, de forma que unos tienen acceso a los datos de otros, se dice que:
Es la última versión del SGBD Oracle Express Edition (XE) con todas la potencia de Oracle.
Gratuita, fácil de descargar y utilizar, recomendado para instituciones educativas.
Oracle
Si tienes una versión anterior y te manejas bien con ella no es necesario para el desarrollo
del módulo que instales la versión 18c XE. Pero si decides hacerlo tendrás que desinstalar
previamente la anterior.
El primer paso que debemos dar es descargar el software necesario desde la página oficial
de Oracle. A través del siguiente enlace podrás acceder a la zona de descarga de Oracle
Database 18c Express Edition, regístrate, escoge el que se ajuste a tus necesidades según
tu sistema operativo y descárgalo en tu ordenador. Si no tienes soltura con Linux te
recomiendo que instales la versión para windows OracleXE184_Win64.zip
En este enlace PDF_Acceso (pdf - 92 KB) tienes los pasos para acceder al usuario
administrador desde SQLPLUS. visualizar el usuario y el contenedor activo, y crear
un usuario.