TECNOLOGÍAS DE INFORMACIÓN PARA LA INNOVACIÓN · Bases de datos no estructuradas Un modelo de...

46
Facultad de Estadística e Informática TECNOLOGÍAS DE INFORMACIÓN PARA LA INNOVACIÓN

Transcript of TECNOLOGÍAS DE INFORMACIÓN PARA LA INNOVACIÓN · Bases de datos no estructuradas Un modelo de...

Facultad de Estadística e Informática

TECNOLOGÍAS DE INFORMACIÓN PARA LA INNOVACIÓN

Facultad de Estadística e Informática

Clase 7Pilares de las Tecnologías de la Informacióna. Bases de datos I. Representación del mundo real en una base de

datos : Diseño conceptual de base de datosi. Modelado de datos utilizando el modelo de

Entidad-Relación

Facultad de Estadística e Informática

Clase 7 BibliografíaElmasri, R., Navathe y S. (2000). Fundamentos de Sistemas de Bases de Datos. España: Pearson Addison-Wesley.

Miguel, A., Piattini M. y Marcos, E. (2000). Diseño de bases de datos relacionales. México: Alfaomega:Ra-Ma.

Marqués, M. (2001). Apuntes de ficheros y bases de datos. Universitat Jaume I, Campus de Riu Sec. España. consultado el 29 enero 2017, en: https://www.researchgate.net/publication/41209120_Apuntes_de_Ficheros_y_Bases_de_Datos

Facultad de Estadística e Informática

Tecnologías de información, Pilares. Bases de datos

Los SGBD relacionales son la segunda generación de los SGBD.

Capacidad de modelar los datos

1976, Chen. Modelo Entidad -

Relación

1979, Codd. Versión extendida RM/T (1979). RM/V2

(1990)

PROBLEMA SOLUCIÓN SOLUCIÓN

Facultad de Estadística e Informática

Diseño de base de datos

Facultad de Estadística e Informática

El diseño conceptual parte de las especificaciones de requisitos de usuario y su resultado es el esquema conceptual de la base de datos.

El objetivo del diseño conceptual es describir el contenido de información de la base de datos y no las estructuras de almacenamiento que se necesitarán para manejar esta información.

(Marqués, 2001)

Tecnologías de información, Pilares. Bases de datos

Facultad de Estadística e Informática

Los modelos conceptuales deben ser buenas herramientas para representar la realidad, por lo que deben poseer las siguientes cualidades (MIGUEL, 2000): Expresividad

Simplicidad

Minimalidad

Formalidad

Tecnologías de información, Pilares. Bases de datos

Facultad de Estadística e Informática

Diseño Conceptual empleando el diagrama Entidad –Relación. Se origina con el fin de que el diseño de la base de datos sea

independiente de la implementación.

Propuesto por Peter P. Chen (CHEN, 1976 citado en Miguel, A. et. al., 2000).

Se utiliza como una herramienta conceptual de apoyo, no es soportado por los SMBD.

Tecnologías de información, Pilares. Bases de datos

Facultad de Estadística e Informática

Metodología de diseño conceptual:Identificar las entidades.

"Entidad es una persona, lugar, cosa, concepto o suceso, real o abstracto, de interés para la empresa" (ANSI, 1997 citado en Miguel, A. et. al., 2000).

Definir los principales objetos que interesan al usuario.

Tecnologías de información, Pilares. Bases de datos

Facultad de Estadística e Informática

Metodología de diseño conceptual:Identificar las entidades.

Buscar objetos importantes como personas, lugares o conceptos de interés, excluyendo aquellos nombres que sólo son propiedades de otros objetos.

El análisis es subjetivo, por lo que distintos diseñadores pueden hacer distintas interpretaciones.

Es un proceso iterativo.

Tecnologías de información, Pilares. Bases de datos

Facultad de Estadística e Informática

Metodología de diseño conceptual:Identificar las entidades.

Se representa mediante rectángulos y se otorgan nombres significativos.

Los nombres de las entidades y sus descripciones se anotan en el diccionario de datos.

Anotar sus alias.

Tecnologías de información, Pilares. Bases de datos

Facultad de Estadística e Informática

Metodología de diseño conceptual:Identificar las relaciones.

Es una correspondencia o asociación entre dos o más entidades.

Cada relación tiene un nombre que describe su función.

Las relaciones se representan gráficamente mediante rombos y su nombre aparece en el interior.

LIBRO

Tecnologías de información, Pilares. Bases de datos

Facultad de Estadística e Informática

Metodología de diseño conceptual:Identificar las relaciones.

Definir las relaciones existentes entre entidades.

Identificar relaciones a través de expresiones verbales.

Interesan las relaciones que son necesarias.

La mayoría son relaciones son binarias (entre dos entidades).

*Determinar la cardinalidad mínima y máxima (0, 1, N) con la que participa cada entidad.

*No se abordará a fondo

Tecnologías de información, Pilares. Bases de datos

Facultad de Estadística e Informática

Metodología de diseño conceptual:Identificar las relaciones.

Correspondencia.

1:1 (uno a uno)

1:N (uno a muchos)

N:M (muchos a muchos)

Cardinalidad. Número mínimo y el número máximo de correspondencias. (0,1), (1,1), (0,n) o (1, n).

Tecnologías de información, Pilares. Bases de datos

Facultad de Estadística e Informática

Metodología de diseño conceptual:Identificar las

relaciones.

Tecnologías de información, Pilares. Bases de datos

Facultad de Estadística e Informática

Metodología de diseño conceptual:Identificar los atributos y asociarlos a entidades y relaciones.

"Es cada una de las propiedades o características que tiene una entidad o relación" (ANSI, 1997 citado en Miguel, A. et. al., 2000).

Se representan mediante círculos que cuelgan de las entidades o relaciones a las que pertenecen.

Tecnologías de información, Pilares. Bases de datos

Facultad de Estadística e Informática

Metodología de

diseño conceptual:Identificar los atributos y asociarlos a entidades y relaciones.

Tecnologías de información, Pilares. Bases de datos

Facultad de Estadística e Informática

Metodología de diseño conceptual:Identificar los atributos y asociarlos a entidades y relaciones.

Cada atributo tiene un conjunto de valores asociados denominado dominio.

Pueden ser simples o compuestos.

Identificador es un atributo o conjunto de atributos que determina de modo único cada ocurrencia de esa entidad.

Tecnologías de información, Pilares. Bases de datos

Facultad de Estadística e Informática

Metodología de diseño conceptual:Identificar los atributos y asociarlos a entidades y relaciones.

Son atributos los nombres que identifican propiedades, cualidades, identificadores o características de entidades o relaciones.

¿Qué información se quiere saber de ...?

Tecnologías de información, Pilares. Bases de datos

Facultad de Estadística e Informática

Metodología de diseño conceptual: Determinar los identificadores: Los identificadores pueden ser simples (un atributo) o compuestos

(dos o más atributos).

Uno de los identificadores será la clave primaria.

Tecnologías de información, Pilares. Bases de datos

Facultad de Estadística e Informática

Metodología de diseño conceptual: Conclusión:Entidades: Personas, lugares, objetos de interés.

Relaciones: Verbos relevantes.

Atributos: Propiedades o características de los objetos.

Tecnologías de información, Pilares. Bases de datos

Facultad de Estadística e Informática

Clase 7Pilares de las Tecnologías de la Informacióna. Bases de datos I. Representación del mundo real en una base de

datos : Diseño conceptual de base de datosi. Modelado de datos utilizando el modelo de

Entidad-Relaciónii. Diseño lógico. Modelo relacional.

Facultad de Estadística e Informática

Diseño lógico de base de datos"Su objetivo es transformar el esquema conceptual obtenido en la etapa anterior, adaptándolo al modelo de datos en el que se apoya el SMBD (modelo relacional en nuestro caso) que se va a utilizar." (Miguel y Piattini, 1999).

Modelo de datos Modelo relacional

Facultad de Estadística e Informática

Diseño lógico de base de datos"El modelo relacional fue presentado por E. F. Codden 1970 en su célebre artículo de ACM titulado 'Un modelo de datos relacional para grandes bancos de datos compartidos', constituyó un hito en la historia de las bases de datos." (Miguel, A. et. al., 2000).

Facultad de Estadística e Informática

Diseño lógico de base de datos

Facultad de Estadística e Informática

Diseño lógico de base de datosUna relación es una tabla con columnas y filas que sirve para representar tanto los objetos como las asociaciones entre ellos (relaciones del modelo entidad-relación) (Marqués, 2001).

Un atributo es el nombre de una columna de una relación y representan a los atributos del modelo entidad-relación.

Facultad de Estadística e Informática

Diseño lógico de base de datos

Facultad de Estadística e Informática

Diseño lógico de base de datosEl Dominio permite que el usuario defina, el significado y la fuente de los valores que los atributos pueden tomar.

Una tupla es una fila de una relación.

La cardinalidad de una relación es el número de tuplas que contiene.

Una base de datos relacional es un conjunto de relaciones normalizadas

Facultad de Estadística e Informática

Diseño lógico de base de datos1. Convertir el esquema conceptual en un esquema lógico.

Las tres reglas básicas para convertir un esquema en el modelo entidad-relación al relacional son las siguientes (Miguel, A. et. al., 2000):

i. Todo tipo de entidad se convierte en una relación.

ii. Toda relación N:M se transforma en una relación

iii. Para toda relación 1:N se realiza lo que se denomina propagación de clave (regla general), o bien se crea una nueva relación.

Facultad de Estadística e Informática

Diseño lógico de base de datos1. Convertir el esquema conceptual en un esquema lógico.

Facultad de Estadística e Informática

Bases de Datos No relacionales o No estructuradas

Facultad de Estadística e Informática

Bases de datos no estructuradasHistoria y definiciónAparecieron en los años 90 con el nombre “open-source

relational database” por Carlo Strozzi, no usaba SQL como lenguaje de consulta, sino que se accedía a través de scripts.

El término NoSQL surgió en el año 2009, ideado por el desarrollador Eric Evans.

Aunque el término no es oficial, responde a las bases de datos con las siguientes características:

Open-source, distributed, nonrelational databases

Facultad de Estadística e Informática

Bases de datos no estructuradas

Bases de datos de Código abierto, Distribuidas, No relacionales

Bases de datos NoSQL

Facultad de Estadística e Informática

Bases de datos no estructuradasCaracterísticas

Tienen una estructura distribuida, es decir, los mismos datos son guardados en distintos servidores (redundancia).

Sus estructuras de datos son sencillas (arreglos de datos o pares clave-valor)

Facultad de Estadística e Informática

Bases de datos no estructuradasBD relacionales vs BD no estructuradasLa principal diferencia radica en la manera de guardar los datos.

Las bases de datos no estructuradas o NoSQL (Not Only SQL) no almacenan tablas ni usan un lenguaje de consulta.

Los datos se almacenan ‘de un recibo’.

Facultad de Estadística e Informática

Bases de datos no estructuradasPorqué bases de datos no estructuradasLos sistemas Web y sistemas de información actuales pesentan

diferentes desafío a los sistemas tradicionales:Datos a gran escala.

Lectura y escritura con gran frecuencia.

Cambios en el esquema de datos (estructura de los datos) con frecuencia.

Las aplicaciones sociales no necesitan el mismo nivel ACID (Atomicidad, Consistencia, Aislamiento y Durabilidad).

Facultad de Estadística e Informática

Bases de datos no estructuradasPor qué bases de datos no estructuradasAlgunos de estos desafíos son:El costo para mantener el rendimiento de la base de datos

relacional es muy alto.

Se generan muchos datos temporales, por ejemplo, carritos de compra, personalización de portales.

El almacén de datos contiene mucho texto, imágenes, etc.

Facultad de Estadística e Informática

Bases de datos no estructuradas

¿Cómo se clasifican?

Facultad de Estadística e Informática

Bases de datos no estructuradasUn modelo de datos es un conjunto de conceptos que sirven para describir la estructura de una base de datos: los datos, las relaciones entre los datos y las restricciones que deben cumplirse sobre los datos.

“El modelo a través del cuál percibimos y manipulamos los datos”

Facultad de Estadística e Informática

Bases de datos no estructuradasModelos de datos de:Documentos.

Clave-valor.

Grafos.

Orientados a columnas.

Orientados a objetos.

Facultad de Estadística e Informática

Facultad de Estadística e Informática

Bases de datos no estructuradasBases de datos de GrafosRegistros pequeños con conexiones

complejas.

Con esta estructura podemos hacer preguntas como:

“ Encuentra los libros, en la categoría Bases de Datos que fueron escritos por alguien quien es del gusto de mis amigos”.

Son ideales para almacenar datos con relaciones complejas, como redes sociales, preferencias de productos, etc.

Facultad de Estadística e Informática

Bases de datos no estructuradasBases de datos de Grafos Son nodos conectados por “arcos”.

Son ideales en ambientes donde el rendimiento de las consultas es la prioridad, sobre la rapidez de escritura.

En muchas ocasiones los datos se encuentran anvegando los bordes: “Todas las cosas que a Anna y Bárbara les gusta”

Facultad de Estadística e Informática

Bases de datos no estructuradasACCESO A DATOSClave-Valor• La aplicación puede leer la

información del cliente y todos los datos relacionados a través de la llave (key).

• Si el requerimiento es leer las órdenes o productos vendidos en cada orden, se debe acceder a el objeto completo por cada cliente.

Facultad de Estadística e Informática

Bases de datos no estructuradasACCESO A DATOSClave-Valor• Esta división ayuda en consultas

como “Qué ordenes contienen un producto determinado”.

Facultad de Estadística e Informática

Gracias por su atención