Download - UNIVERSIDAD DE GUAYAQUIL FACULTAD DE …repositorio.ug.edu.ec/bitstream/redug/18111/1/UG-FCMF-B-CINT-PTG-… · Análisis y Creación del modelo de Base de Datos para la gestión

UNIVERSIDAD DE GUAYAQUIL

FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS

CARRERA DE INGENIERÍA EN NETWORKING Y TELECOMUNICACIONES

Análisis y Creación del modelo de Base de Datos para la gestión de las variables

que definen los modelos de contaminación ambiental en el aire, agua, tierra y

especies vivas dentro del proyecto de definición de escenarios de la

contaminación petrolera en Ecuador del programa MONOIL

PROYECTO DE TITULACIÓN

Previa a la obtención del Título de:

INGENIERO EN NETWORKING Y TELECOMUNICACIONES

AUTOR (ES):

PEDRO VILLAFUERTE YAGUAL

TUTOR:

ING. CHRISTIAN ANTÓN CEDEÑO

GUAYAQUIL – ECUADOR

2016

REPOSITORIO NACIONAL EN CIENCIAS Y TECNOLOGÍA

FICHA DE REGISTRO DE TESIS

TÍTULO “Análisis y Creación del modelo de Base de Datos para la gestión de las variables que

definen los modelos de contaminación ambiental en el aire, agua, tierra y especies vivas dentro

del proyecto de definición de escenarios de la contaminación petrolera en Ecuador del programa

MONOIL”

REVISORES:

Ing. Adiel Castaño Méndez, M.Sc

Ing. Marjorie Arias Domínguez, M.sc

INSTITUCIÓN: Universidad de Guayaquil FACULTAD: Ciencias Matemáticas y

Físicas

CARRERA: Ingeniería en Networking y Telecomunicaciones

FECHA DE PUBLICACIÓN: N° DE PÁGS.:

151

ÁREA TEMÁTICA: BASE DE DATOS PETROLERA

PALABRAS CLAVES: BASES DE DATOS CIENTÍFICAS, GESTIÓN DE CONOCIMIENTO,

PATRONES DE DISEÑO, SCRUM, CONTAMINACIÓN AMBIENTAL.

RESUMEN: El proyecto consiste es brindar una estructura unificada elaborada en el gestor de base

de datos libre PostgreSQL que contenga las variables de contaminación ambiental petrolera. Variables

brindadas por los indicadores de la CEPAL y OMS analizadas mediante la investigación sobre datos

petroleras utilizando sistemas libres.

N° DE REGISTRO (en base de datos): N° DE CLASIFICACIÓN:

Nº

DIRECCIÓN URL (tesis en la web):

ADJUNTO PDF X

SI NO

CONTACTO CON AUTOR:

Pedro Xavier Villafuerte yagual Teléfono:

0967350943

E-mail:

[email protected]

CONTACTO DE LA INSTITUCIÓN Nombre: SECRETARIA

Teléfono: 042565297

II

CARTA DE APROBACIÓN DEL TUTOR

En mi calidad de Tutor del trabajo de investigación, “Análisis y Creación del modelo

de Base de Datos para la gestión de las variables que definen los modelos de

contaminación ambiental en el aire, agua, tierra y especies vivas dentro del

proyecto de definición de escenarios de la contaminación petrolera en Ecuador del

programa MONOIL“ elaborado por el Sr. PEDRO VILLAFUERTE YAGUAL

Alumno no titulado de la Carrera de Ingeniería en Networking y

Telecomunicaciones de la Facultad de Ciencias Matemáticas y Físicas de la

Universidad de Guayaquil, previo a la obtención del Título de Ingeniero en

Networking y Telecomunicaciones, me permito declarar que luego de haber

orientado, estudiado y revisado, la Apruebo en todas sus partes.

ING. CHRISTIAN ANTÓN CEDEÑO

TUTOR

III

DEDICATORIA

Dedico esta tesis, a mis padres que siempre me han apoyado en

todo momento y gracias a sus esfuerzos he salido adelante, a mi

hijo por ser una pieza importante que me motiva a crecer

profesionalmente, y a todas aquellas personas que de alguna

manera me han brindado su apoyo.

IV

AGRADECIMIENTO

Agradezco a Dios por permitirme cumplir esta meta tan importante en

mi vida, a mi familia que me han apoyado en todo este tiempo para

poder culminar mi carrera Universitaria, a mis maestros por sus

enseñanzas y consejos durante mi etapa estudiantil.

V

TRIBUNAL PROYECTO DE TITULACIÓN

Ing. Eduardo Santos Baquerizo, M.Sc.

DECANO DE LA FACULTAD

CIENCIAS MATEMÁTICAS Y FÍSICAS

Ing. Harry Luna Aveiga, M.Sc.

DIRECTOR

CARRERA DE INGENIERÍA EN NETWORKING Y

TELECOMUNICACIONES

Ing. Christian Picón Farah, M.Sc. PROFESOR REVISOR DEL ÁREA

TRIBUNAL

Ing. Lorenzo Cevallos Torres, M.Sc.

PROFESOR REVISOR DEL ÁREA TRIBUNAL

Ing. Christian Antón Cedeño, M.Sc.

PROFESOR DIRECTOR DEL PROYECTO

DE TITULACIÓN

Ab. Juan Chávez Atocha, Esp.

SECRETARIO

VI

DECLARACIÓN EXPRESA

“La responsabilidad del contenido de este Proyecto de Titulación, me

corresponden exclusivamente; y el patrimonio intelectual de la misma a la

UNIVERSIDAD DE GUAYAQUIL”

PEDRO XAVIER VILLAFUERTE YAGUAL

VII

.




ANÁLISIS Y CREACIÓN DEL MODELO DE BASE DE DATOS PARA LA

GESTIÓN DE LAS VARIABLES QUE DEFINEN LOS MODELOS DE

CONTAMINACIÓN AMBIENTAL EN EL AIRE, AGUA, TIERRA Y

ESPECIES VIVAS DENTRO DEL PROYECTO DE DEFINICIÓN

DE ESCENARIOS DE LA CONTAMINACIÓN PETROLERA

EN ECUADOR DEL PROGRAMA MONOIL

Proyecto de Titulación que se presenta como requisito para optar por el título de

INGENIERO en NETWORKING Y TELECOMUNICACIONES

Autor/a: PEDRO VILLAFUERTE YAGUAL

C.I: 0925281743

Tutor: ING. CHRISTIAN ANTÓN CEDEÑO

Guayaquil, diciembre del 2016

VIII

CERTIFICADO DE ACEPTACIÓN DEL TUTOR

En mi calidad de Tutor del proyecto de titulación, nombrado por el Consejo

Directivo de la Facultad de Ciencias Matemáticas y Físicas de la Universidad de

Guayaquil.

CERTIFICO:

Que he analizado el Proyecto de Titulación presentado por el/la estudiante

PEDRO XAVIER VILLAFUERTE YAGUAL, como requisito previo para optar por

el título de Ingeniero en Networking y Telecomunicaciones cuyo tema es:

“ANÁLISIS Y CREACIÓN DEL MODELO DE BASE DE DATOS PARA LA


CONTAMINACIÓN AMBIENTAL EN EL AIRE, AGUA, TIERRA Y ESPECIES

VIVAS DENTRO DEL PROYECTO DE DEFINICIÓN DE ESCENARIOS DE LA

CONTAMINACIÓN PETROLERA EN ECUADOR DEL PROGRAMA MONOIL”

Considero aprobado el trabajo en su totalidad.

Presentado por:

VILLAFUERTE YAGUAL PEDRO XAVIER 0925281743

Tutor: ING. CHRISTIAN ANTÓN CEDEÑO

Guayaquil, diciembre del 2016

IX




Autorización para Publicación de Proyecto de Titulación en Formato

Digital

1. Identificación del Proyecto de Titulación

Nombre Alumno: Pedro Xavier Villafuerte Yagual

Dirección: Urb. Paraísos del Rio 2 Mz. 3059 V. 12

Teléfono:

0967350943

E-mail:

[email protected]

Facultad: Matemáticas y Físicas

Carrera: Ingeniería en Networking y Telecomunicaciones

Título al que opta: Ingeniero en Networking y Telecomunicaciones

Profesor guía: Ing. Christian Antón Cedeño

Título del proyecto de Investigación: “Análisis y Creación del modelo de Base

de Datos para la gestión de las variables que definen los modelos de

contaminación ambiental en el aire, agua, tierra y especies vivas dentro del

proyecto de definición de escenarios de la contaminación petrolera en Ecuador

del programa MONOIL”.

Tema del Proyecto de Titulación: Implementación de la base de datos

científica en los modelos de contaminación ambiental del programa MONOIL. 2. Autorización de Publicación de Versión Electrónica del Proyecto de

Titulación

A través de este medio autorizo a la Biblioteca de la Universidad de Guayaquil y a

la Facultad de Ciencias Matemáticas y Físicas a publicar la versión electrónica de

este Proyecto de titulación.

Publicación electrónica:

Inmediata X Después de 1 año

Firma Alumno:

3. Forma de envío:

El texto del proyecto de titulación debe ser enviado en formato Word, como

archivo .Doc. O .RTF y. Puf para PC. Las imágenes que la acompañen pueden

ser: .gif, .jpg o .TIFF.

DVDROM

CDROM X

mailto:[email protected]

X

ÍNDICE GENERAL

CARTA DE APROBACIÓN DEL TUTOR ..................................................................... II

DEDICATORIA ............................................................................................................ III

AGRADECIMIENTO .................................................................................................... IV

TRIBUNAL PROYECTO DE TITULACIÓN .................. ¡Error! Marcador no definido.

DECLARACIÓN EXPRESA ......................................................................................... VI

CERTIFICADO DE ACEPTACIÓN DEL TUTOR ...................................................... VIII

Autorización para Publicación de Proyecto de Titulación en Formato Digital ............ IX

ÍNDICE GENERAL ....................................................................................................... X

ABREVIATURAS ........................................................................................................ XII

SIMBOLOGÍA ............................................................................................................ XIII

ÍNDICE DE CUADROS .............................................................................................. XIV

ÍNDICE DE GRÁFICOS ............................................................................................. XVI

Resumen ................................................................................................................... XVII

Abstract ...................................................................................................................... XIX

INTRODUCCIÓN .......................................................................................................... 0

CAPÍTULO I .................................................................................................................. 2

EL PROBLEMA ............................................................................................................ 2

PLANTEAMIENTO DEL PROBLEMA .......................................................................... 2

Ubicación del problema en un contexto ....................................................................... 2

Situación Conflicto Nudos Críticos ............................................................................... 4

Causas y Consecuencias del Problema ....................................................................... 5

Delimitación del Problema ............................................................................................ 6

Formulación del Problema ............................................................................................ 7

Evaluación del Problema .............................................................................................. 7

OBJETIVOS DE LA INVESTIGACIÓN ......................................................................... 8

Objetivo general ............................................................................................................ 8

Objetivos específicos .................................................................................................... 8

Alcances del Problema ................................................................................................. 9

JUSTIFICACIÓN E IMPORTANCIA DE LA INVESTIGACIÓN .................................. 10

CAPÍTULO II ............................................................................................................... 12

MARCO TEÓRICO ..................................................................................................... 12

ANTECEDENTES DEL ESTUDIO ............................................................................. 12

FUNDAMENTACIÓN TEÓRICA ................................................................................. 15

XI

FUNDAMENTACIÓN SOCIAL ................................................................................... 42

FUNDAMENTACIÓN LEGAL ..................................................................................... 43

HIPÓTESIS DE LA INVESTIGACIÓN DOCUMENTAL ............................................. 50

Variables de la Investigación ...................................................................................... 51

DEFINICIONES CONCEPTUALES............................................................................ 51

CAPÍTULO III .............................................................................................................. 54

METODOLOGÍA DE LA INVESTIGACIÓN ................................................................ 54

DISEÑO DE LA INVESTIGACIÓN ............................................................................. 54

Modalidad de la Investigación .................................................................................... 54

TIPOS DE INVESTIGACIÓN ...................................................................................... 55

MÉTODOS DE INVESTIGACIÓN .............................................................................. 56

POBLACIÓN Y MUESTRA ......................................................................................... 60

Instrumentos de recolección de datos ........................................................................ 61

Recolección de la Información ................................................................................... 64

Procesamiento y Análisis ........................................................................................... 64

Validación de la Hipótesis .......................................................................................... 72

CAPÍTULO IV.............................................................................................................. 73

PROPUESTA TECNOLÓGICA .................................................................................. 73

Análisis de Factibilidad ............................................................................................... 73

Factibilidad Operacional ............................................................................................. 74

Factibilidad Técnica .................................................................................................... 75

Factibilidad Legal ........................................................................................................ 76

Factibilidad Económica ............................................................................................... 77

Etapas de la metodología del proyecto ...................................................................... 81

Entregables del proyecto .......................................................................................... 120

Criterios de validación de la propuesta .................................................................... 121

Criterios de aceptación del Producto o Servicio ...................................................... 122

CONCLUSIONES Y RECOMENDACIONES ........................................................... 124

BIBLIOGRAFÍA ......................................................................................................... 126

ANEXO 1 .................................................................................................................. 129

ANEXO 2 .................................................................................................................. 131

ANEXO 3 .................................................................................................................. 148

XII

ABREVIATURAS

SQL Lenguaje de Consultas Estructuradas

UG Universidad de Guayaquil

CEPAL Comisión Económica para América Latina.

OMS Organización Mundial de la Salud.

BD Base de Datos.

Http Protocolo de transferencia de Hyper Texto

Ing. Ingeniero.

CC.MM. FF Facultad de Ciencias Matemáticas y Físicas

www World Wide Web (red mundial)

SGBD Sistema Gestor de Base de Datos.

GPL Licencia Publica General.

S. O Sistema Operativo.

HAP’S Hidrocarburos Policíclicos Aromáticos.

V.I Variable Independiente.

V.D Variable Dependiente.

E/R Entidad – Relación.

XIII

SIMBOLOGÍA

B/C Costo Beneficio

VAI Valor Actual de Ingresos

VAC Valor Actual de Costos de Inversión.

F Frecuencia Relativa.

C Modalidad.

N Frecuencia Absoluta.

N Población.

XIV

ÍNDICE DE CUADROS

Pág.

Cuadro #1: Causas y Consecuencias ...................................................................... 5 Cuadro #2: Versiones de PostgreSQL ................................................................... 29 Cuadro #3: Notación Húngara como estándar de una base de datos ................ 36 Cuadro #4: Catálogos de PostgreSQL ................................................................... 41 Cuadro #5: Matriz de Operacionalización de Variables Dependientes e

Independientes del proyecto. .................................................................................. 61 Cuadro #6: Variables Cualitativas I usado en entrevistas ................................... 65 Cuadro #7: Variables Cualitativas II usado en entrevistas .................................. 65 Cuadro #8: Variables Cualitativas III usado en entrevistas ................................. 65 Cuadro #9: Frecuencia variable Edad .................................................................... 66 Cuadro #10: Información Documentada en proyecto – pregunta 1 .................... 67 Cuadro #11: Trabajo realizado en unificación de base de datos – pregunta

2 .................................................................................................................................. 68 Cuadro #12: Entendimiento modelo E/R – pregunta 3 ......................................... 69 Cuadro #13: Entendimiento estructura MONOIL – pregunta 4 ............................ 70 Cuadro #14: Uso de esquemas en base de datos – pregunta 5 .......................... 71 Cuadro #15: Comparativo de ingresos y egresos en el proyecto. ...................... 77 Cuadro #16: Concepto de egresos en el proyecto ............................................... 78 Cuadro #17: Presupuesto estimado actual MONOIL ............................................ 80 Cuadro #18: Costo estimado actual MONOIL ........................................................ 80 Cuadro #19: Análisis FODA ..................................................................................... 82 Cuadro #20: Estándar de la base de datos ............................................................ 96 Cuadro #21: Creación de la estructura del BD ...................................................... 97 Cuadro #22: Identificación variables de contaminación petrolera ..................... 97 Cuadro #23: Identificación de variables de la CEPAL .......................................... 97 Cuadro #24: Identificación de variables OMS ....................................................... 98 Cuadro #25: Análisis de variables contaminación con investigadores del

proyecto MONOIL ..................................................................................................... 98 Cuadro #26: Análisis de variables de la CEPAL y OMS con

desarrolladores WS .................................................................................................. 99 Cuadro #27: Creación de estructura para BD de contaminación petrolera ....... 99 Cuadro #28: Creación de estructura para BS de las API CEPAL y OMS ......... 100 Cuadro #29: Unificación de esquemas ................................................................ 100 Cuadro #30: Análisis de propuesta de un sistema de monitoreo en

servidor de BD PostgreSQL .................................................................................. 101 Cuadro #31: Reunión de planeación del proyecto .............................................. 101 Cuadro #32: Sprint MONOIL .................................................................................. 103 Cuadro #33: Historia de Usuario 1 ........................................................................ 104 Cuadro #34: Historia de Usuario 2 ........................................................................ 104 Cuadro #35: Historia de Usuario 3 ........................................................................ 105 Cuadro #36: Historia de Usuario 4 ........................................................................ 108

XV

Cuadro #37: Historia de Usuario 5 ........................................................................ 108 Cuadro #38: Historia de Usuario 6 ........................................................................ 109 Cuadro #39: Historia de Usuario 7 ........................................................................ 113 Cuadro #40: Historia de Usuario 8 ........................................................................ 113 Cuadro #41: Historia de Usuario 9 ........................................................................ 114 Cuadro #42: Historia de usuario 10 ...................................................................... 118 Cuadro #43: Historia de Usuario 11 ...................................................................... 118 Cuadro #44: Matriz de aceptación ........................................................................ 122

XVI

ÍNDICE DE GRÁFICOS

Pág.

Grafico # 1: Fases de la Industria Petrolera .......................................................... 16 Grafico # 2: Sistema de Gestión en una Base de Datos ...................................... 22 Grafico # 3: Componentes del Sistema PostgreSQL ........................................... 26 Grafico # 4: Funcionamiento del optimizador de Consultas ............................... 37 Gráfico # 5: Representación de Pregunta 1 ........................................................... 67 Gráfico # 6: Representación de Pregunta 2 ........................................................... 68 Gráfico # 7: Representación de Pregunta 3 ........................................................... 69 Gráfico # 8: Representación de Pregunta 4 ........................................................... 70 Gráfico # 9: Representación de Pregunta 5 ........................................................... 71 Grafico # 10: Análisis de factibilidad de un problema ......................................... 74 Grafico # 11: Esquema Conexión Cliente/Servidor .............................................. 76 Grafico # 12: Egresos del Proyecto ........................................................................ 78 Grafico # 13: Diagrama de Causa – Efecto ............................................................ 84 Grafico # 14: Análisis Estándar BD ........................................................................ 87 Grafico # 15: Análisis Esquema CEPAL ................................................................. 88 Grafico # 16: Análisis Esquema OMS ..................................................................... 89 Grafico # 17: Análisis Esquema Contaminación ................................................... 90 Grafico # 18: Análisis Unificación de Esquemas .................................................. 91 Grafico # 19: Historia de Usuario 1 – Estándar BD ............................................. 105 Grafico # 20: Historia de Usuario 2 – Creación Esquemas ................................ 106 Grafico # 21: Historia de Usuario 3 – Esquema General .................................... 107 Grafico # 22: Historia de Usuario 4 – Definición Variables ................................ 109 Grafico # 23: Historia de Usuario 5 – Validación de Variables .......................... 110 Grafico # 24: Historia de Usuario 5 – Generación dinámica de tablas ............. 111 Grafico # 25: Historia de Usuario 6 – Ejecución de Job ..................................... 111 Grafico # 26: Historia de Usuario 6 – Esquema CAM ......................................... 112 Grafico # 27: Historia de Usuario 7 – Validación de datos ................................ 115 Grafico # 28: Historia de Usuario 8 – Análisis de variables............................... 116 Grafico # 29: Historia de Usuario 9 – Esquema API ........................................... 117 Gráfico # 30: Historia de Usuario 10 ..................................................................... 119 Gráfico # 31: Historia de Usuario 11 ..................................................................... 120

XVII

UNIVERSIDAD DE GUAYAQUIL FACULTAD DE CIENCIAS MATEMÁTICAS Y

FÍSICAS CARRERA DE INGENIERÍA EN NETWORKING Y

TELECOMUNICACIONES







Autor: Pedro Villafuerte Yagual Tutor: Ing. Christian Antón Cedeño

Resumen

Actualmente existen diversos repositorios de bases de datos dedicados a la

contaminación ambiental en todo el mundo, pero no existe un repositorio que

tenga información sobre los problemas ocasionados por el petróleo en el aire,

agua, tierra, especies vivas sobre las áreas cercanas a la Amazonia Ecuatoriana,

la parroquia Dayuma ubicados en la misma región amazónica y sobre los

indicadores socioeconómicos en el mundo que brinda la CEPAL y OMS. El

objetivo de este proyecto es brindar una estructura unificada elaborada en el

gestor de base de datos libre PostgreSQL que contenga las variables de

contaminación ambiental petrolera. Variables brindadas por los indicadores de la

CEPAL y OMS analizadas mediante la investigación sobre datos petroleras

utilizando sistemas libres. Información documentada mediante revistas o libros

para posterior a eso ser proporcionada al proyecto bi-nacional entre los gobiernos

XVIII

de Francia/Ecuador MONOIL (Monitoreo ambiental, salud, sociedad y petróleo en

el Ecuador) para que puedan ser usados por sus investigadores. El objetivo es

entregar un proyecto que cumpla con los principios de normalización y

estandarización de bases de datos. Junto con los modelos lógicos y de Entidad

Relación se proporcionará una estructura factible y viable haciendo uso de la

metodología SCRUM por el marco de trabajo elaborado entre investigadores e

desarrolladores miembros del proyecto.

Palabras clave: Base de datos científica, Gestión de conocimiento, Patrones de

diseño, SCRUM, Contaminación Petrolera.

XIX

UNIVERSIDAD DE GUAYAQUIL FACULTAD DE CIENCIAS MATEMÁTICAS Y

FÍSICAS CARRERA DE INGENIERÍA EN NETWORKING Y

TELECOMUNICACIONES







Autor: Pedro Villafuerte Yagual Tutor: Ing. Christian Antón Cedeño

Abstract

Currently, there are several database repositories dedicated to environmental

pollution worldwide, but there is no repository that has information about the

problems caused by oil in the air, water, soil, living species in the areas near the

Ecuadorian Amazon, the Dayuma parish (located in the same Amazon region),

and the economic indicators in the world provided by the CEPAL and the OMS.

The purpose of this project is to provide a unified structure, developed in

PostgreSQL open database which contains the variables of the oil pollution.

Variables provided by the CEPAL and the OMS indicators and analyzed the

investigation of the oil data using open source systems. The documented

information was done through magazines or books so that after that, be provided

to the bi-national project between the governments of France / Ecuador MONOIL

(environmental monitoring, health, society and oil in Ecuador) so they can be used

XX

by their researchers. The aim is to deliver a project that meets the principles of

standardization of databases. Along with logic models, and Entity Relationship, a

feasible and viable structure will be provided using the SCRUM methodology

developed by the members of the project who are all researchers and developers.

Key words: scientific database, knowledge management, design patterns,

SCRUM, Oil Pollution.

INTRODUCCIÓN

Las industrias petroleras durante la última década han mantenido y aumentado

una serie de trabajos constantes ya sea estas por perforaciones de pozos, análisis

de infraestructuras, producción de materiales pétreos y el constante uso de

químicos necesarios para la explotación petrolera, este conjunto de labores ha

permitido cambios en el ambiente natural, actualmente existen muchos

repositorios de Bases de datos que almacenan toda esta información sobre las

problemáticas ocasionadas por las industrias petroleras y sus derivados. Pero no

existe un repositorio de datos general que contenga información de varias

organizaciones socioeconómicas (área petróleo), organizaciones ambientales y

organizaciones privadas dedicadas a analizar la Amazonia Ecuatoriana.

Mediante censos se han logrado determinar las variables primarias de aquellos

indicadores que son parte de la afectación de la contaminación petrolera como lo

son los Censos Nacionales, sistemas de encuestas de condiciones de vida y

ciertos mecanismos Administrativos. (Bustamante & Jarrín, 2011).

En ciertos países como en México se construyó una base de datos que integre

toda la información obtenida sobre los contaminantes Orgánicos “COP” y lograr

definir mecanismos de coordinación factibles a nivel nacional y disminuir los

riesgos (Gavilán & Martínez, 2004). Debido a la gran cantidad de información que

se puede llegar a procesar respecto a los problemas ambientales en ciertas

empresas se desarrollan módulos de gestores de datos usando algoritmos

precisos que optimizan el rendimiento de la herramienta PostgreSQL (Robles

Aranda & R. Sotolongo, INTEGRACIÓN DE LOS ALGORITMOS DE MINERÍA DE

DATOS 1R, PRISM E ID3 A POSTGRESQL, 2013).

En base a los problemas ambientales ocasionados por el petróleo y con toda la

información recopilada en base a estos contaminantes, y la información que

brindan organizaciones sin fines de lucro como la CEPAL y OMS que publican su

base de datos libre para que sean utilizadas por otras empresas, nace el proyecto

bi-nacional entre los gobiernos de Francia y Ecuador denominado MONOIL donde

1

uno de sus objetivos es centralizar en un solo repositorio de datos toda la

información de daños ambientales petroleros y de indicadores socioeconómicos

haciendo uso de las mejores técnicas de optimización en el manejo de scripts

SQL. Se hará más fácil realizar consultas y obtener información por parte de

investigadores ambientales sobre los problemas ocasionados por el petróleo en el

agua, aire, tierra y especies vivas en la Amazonia Ecuatoriana y sobre la parroquia

Dayuma. Con este repositorio podemos tener un control estadístico de aquellos

elementos que afectan a los pobladores de la región producidos netamente por el

petróleo. Mediante las respectivas técnicas de optimización y afinamiento en base

de datos estos podrán ser consumidos por entidades públicas o privadas con un

tiempo de respuesta moderado para evitar afectaciones futuras. Este proyecto se

realiza en conjunto con miembros investigadores y desarrolladores pertenecientes

al proyecto MONOIL en donde se evalúa las variables de contaminación obtenidas

durante el proyecto de titulación.

A continuación, se detallan los 4 capítulos que constan en este trabajo.

En el Capítulo I, incluye el problema en la investigación y el beneficio que traerá

hacia MONOIL, se detallan los procesos tecnológicos, delimitación, planteamiento

al problema, conflictos, los objetivos y la importancia.

En el Capítulo II, se incluyen las variables utilizadas en la investigación para crear

el modelado de la BD, se detallas las fundamentaciones teóricas, legal y social,

así como las definiciones conceptuales.

En el Capítulo III, se detalla la metodología AGIL:SCRUM que es la usada en el

proyecto así como los tipos y métodos de investigación usados.

En el capítulo IV, se analiza detalladamente la metodología usada y la factibilidad

de usar el modelado de la base de datos usando los esquemas de la CEPAL, OMS

y de Contaminación ambiental.

2

CAPÍTULO I

EL PROBLEMA

PLANTEAMIENTO DEL PROBLEMA

Ubicación del problema en un contexto

Desde la década de 1960 se viene intensificando la explotación de petróleo en la

región amazónica ecuatoriana afectando severamente a el ecosistema y el medio

ambiente y a los pobladores de manera socioeconómica y sanitaria, teniendo un

estimado de perjuicios económicos superiores al 50% superando lo mas de 10

millones de galones en derrame producido en Alaska en 1989 (Almeida y Proaño

2008), a esto se suma la falta de conocimiento de los pobladores sobre el daño

sanitario provocado por los HAPS(Hidrocarburos Aromáticos Poli cíclicos) y los

metales pesados producidos por la actividad petrolera.

Entre la diversidad de metales pesados con una mayor densidad tóxica o

venenosa en concentraciones bajas tenemos varios como el mercurio(Hg), cadmio

(Cd), arsénico (As), cromo (Cr), plomo (Pb) entre otros. También tenemos una

diversidad de metales pesados sumamente esenciales para el correcto

funcionamiento en el metabolismo sobre el ser humano como el Cobre (Cu), zinc

(Zn) o selenio (Se), tomando en consideración que deben estar presentes en

pequeñas cantidades ya que en concentraciones muy altas puede provocar

envenenamiento.

Estos metales pueden incorporarse al agua a través de los residuos dejados en

ríos por las empresas petroleras sin utilizar algún tipo de tratamiento residual, en

la tierra también existen este tipo de metales los cuales son beneficiosos para la

fertilidad de la tierra Silicio (Si), Aluminio (Al), Hierro (Fe), Calcio (Ca), Potasio(K),

Magnesio (Mg) (Mahler, 2003). Pero si los contenidos de estos superan los límites

permitidos, afectan considerablemente la sostenibilidad de los suelos (Martin,

2000).

3

Estos contaminantes pesados provocan efectos tanto leves como graves en la

salud humana al ser consumidos por una variedad de medios como lo pueden ser

el agua, aire o tierra. Se considera agudo cuando el organismo humano puede

combatir estos contaminantes microbianos como si fuese un germen, pero si la

cantidad es elevada sobrepasando el máximo permitido se la considera crónico

ya que es capaz de provocar cáncer, daños en riñones, hígado o problemas en la

reproducción. Se considera que el Cadmio (Cd) es el mineral que más problemas

ha causado en la salud humana (WHO, 1992).

Toda esta información se encuentra almacenada en diversos repositorios de datos

en el mundo que se encargan de analizar los daños ambientales producidos por

el petróleo inclusive almacenan datos sobre los problemas socioeconómicos y

ambientales. Sistemas que son actualizados y monitoreados constantemente para

su libre uso por parte de investigadores, entidades públicas, privadas y

gubernamentales.

Los investigadores son las personas que se encargan de analizar detalladamente

los resultados de nuevas investigaciones y constatar si es idóneo ser almacenado

en los repositorios de datos de cada entidad gubernamental.

Entre las entidades gubernamentales tenemos a la CEPAL (LA COMISIÓN

ECONÓMICA PARA AMÉRICA LATINA Y EL CARIBE), OMS (LA

ORGANIZACIÓN MUNDIAL DE LA SALUD), ITOPF (THE INTERNATIONAL

TANKER OWNERS POLLUTION FEDERATION LIMITED) que se encargan de

publicar todas sus investigaciones sobre salud, economía, daños ambientales

provocados por el petróleo, fenómenos naturales y otros indicadores para el

beneficio y conocimiento de la población.

En base a estos resultados se ha logrado generar reportes, informes estadísticos,

porcentaje de vulnerabilidades, métricas de afectación (tierra, agua, aire, especies

vivas), indicadores periódicos, perfiles regionales o nacionales, información que

es actualizada constantemente por lo tanto sus datos son reales.

4

Gran parte de los repositorios de base de datos se centran en una problemática

en general es decir por países o regiones, pero no en una fuente de información

a profundidad sobre determinadas zonas como la amazonia ecuatoriana, en base

a este requerimiento surge MONOIL (MONITOREO AMBIENTAL, SALUD,

SOCIEDAD Y PETROLEO EN ECUADOR), proyecto de investigación

interdisciplinaria binacional Francia/Ecuador entidad que se encarga de medir,

monitorear, reducir y prevenir la contaminación petrolera y medioambiental en la

amazonia y Costa Pacífica.

Este proyecto tiene como premisa tener un solo repositorio de datos que contenga

la información de varias entidades (incluyendo la CEPAL Y OMS) en uno solo y

que sea capaz de retroalimentarse con la información que sea almacenada por

los investigadores y/o científicos.

Situación Conflicto Nudos Críticos

Existen repositorios de base de datos globales que toman en cuenta las siguientes

características:

1. Se enfrascan en la información de determinadas regiones, países o

continentes.

2. Mezclan los datos socioeconómicos, ambientales, políticos, etc.

3. Sus datos solo pueden ser actualizados por investigadores acreditados.

4. Los datos no son compartidos entre las organizaciones gubernamentales.

Características que permiten determinar cómo las bases de datos son usadas

para el manejo de información acorde a sus necesidades como los repositorios de

las entidades gubernamentales como la CEPAL, OMS, ITOPF, etc. Esta tarea

implica que cuando se desee consultar una base se deba evaluar los repositorios

que se acoplen a nuestro requerimiento.

5

A pesar de toda la información que se dispone, no existe un repositorio dedicado

netamente a la amazonia ecuatoriana y los problemas de contaminación causado

por el petróleo o sus derivados (Metales pesados).

Causas y Consecuencias del Problema

Cuadro #1: Causas y Consecuencias

Causas Consecuencias

1. La falta de estándares para la

manipulación de datos permitiendo

que cada organización maneje su

propia base de datos.

Varias fuentes de información

existentes, pero ninguna nos muestra

el resultado esperado.

2. La falta de un esquema de base de

datos que represente netamente

los problemas de contaminación

en la amazonia ecuatoriana.

Consumir repositorio de datos

externos para generar reportes

propios.

3. El investigador no tiene algún lugar

digital donde almacenar su

información.

El desgaste hacia los investigadores o

científicos provocado por la

corrección, clasificación, verificación y

archivado de la información.

4. La falta de conocimiento sobre

bases de datos.

La transformación de la data obtenida

debe ser manejada cuidadosamente,

para no cambiar el contenido de

origen de la información que ingresa.

5. Al depender de otros repositorios

puede existir la probabilidad de

una base de datos desactualizada.

Divulgar información retrasada.

Fuente: Pedro Villafuerte Yagual

Elaborado por: Pedro Villafuerte Yagual

6

Delimitación del Problema

Una vez realizado el análisis del diseño de la base de datos del proyecto MONOIL

se debe establecer la estructura general para luego ser modelado, diseñado e

implementado. El diseño debe estar esquematizado de la mejor forma posible para

evitar reajustes en caso se quiera acoplar a otros proyectos.

También debemos tomar en cuenta los siguientes puntos.

1. El repositorio de base de datos MONOIL, es usado y actualizado por

investigadores públicos, científicos, entidades gubernamentales.

2. Es capaz de migrar la información de los repositorios de la CEPAL y OMS

a la base de datos de MONOIL.

3. La actualización es constante.

4. Tiene una estructura capaz de almacenar información sobre los problemas

ocasionados por el Petróleo en el oriente ecuatoriano en base a

investigaciones científicas.

5. Respecto a la base de datos se maneja los esquemas para optimizar las

consultas por parte de los usuarios.

6. Reducir tiempos de respuesta en generación de reportes o consultas de

base de datos.

7. Manejar roles para el uso de la base de datos, así poder utilizar el mínimo

de recursos de memoria.

7

Formulación del Problema

¿Será factible realizar un modelo de base de datos que almacene toda clase de

información relacionada a la contaminación ambiental ocasionada por el petróleo,

sus derivados e información sobre los indicadores socioeconómicos de entidades

como la CEPAL, OMS, y se acople a cualquier proyecto investigativo sin afectar

la calidad de sus registros?

Evaluación del Problema

Evidente: Durante el traspaso de información se pueden presentar problemas por

los tipos de datos a migrar, para ello se debe realizar el monitoreo sobre el

modelado de base de datos, mediante esta técnica podemos encontrar la

necesidad de la transformación de los datos para evitar afectaciones futuras.

Relevante: Este proyecto optimiza los tiempos de búsqueda de información por

parte de investigadores, científicos o cualquier entidad gubernamental haciendo

uso de esta base de datos lo suficientemente robusta, este cambio también

disminuiría en gastos económicos ya que se reduce el tiempo de investigación.

Original: en la región no existe una base de datos dedicada a los problemas

causados por la contaminación petrolera y sus derivados, este es un teman poco

explorado en el país por lo tanto se debe monitorear la correcta creación del

modelado de base de datos por ser una de las estructuras principales del proyecto.

Contextual: El proyecto también puede ser utilizado en el ámbito académico,

brindando un aporte de manera significativa, ya que en si es otra alternativa como

fuente de información local y a la vez global, con información actualizada de

manera constante.

Factible: Este proyecto es sumamente factible ya que la migración de los datos

de la CEPAL, OMS u otro repositorio de datos es perfectamente realizable dado

que se trata de un estudio extenso tomando en cuenta todas las variables actuales

y las que se pueden presentar en un futuro.

8

Identifica los productos esperados: Por medio de este proyecto no solo se

demuestra la interacción de nuestra base con la información ingresada por los

investigadores, también se demuestra la integridad con otras bases a nivel global.

OBJETIVOS DE LA INVESTIGACIÓN

Objetivo general

Realizar el análisis y modelamiento SQL de los distintos medios de contaminación

ambiental producidos por el petróleo en el aire, agua, tierra, especies vivas sobre

la amazonia ecuatoriana y la parroquia Dayuma utilizando como base de datos

PostgreSQL para crear un repositorio General capaz de integrar los modelos de

base de datos de los Investigadores de MONOIL, base de datos de la CEPAL y

OMS, permitiendo facilitar el trabajo de búsqueda de información y tener

información precisa sobre la contaminación petrolera en la amazonia Ecuatoriana.

Objetivos específicos

Realizar un estudio sobre el modelamiento de bases de datos SQL sobre

contaminación ambiental, para lograr una estructura acorde a los estándares

de desarrollo actual y se pueda acoplar a la base de datos de otros

repositorios de datos públicos.

Identificar los requerimientos de los investigadores del proyecto MONOIL,

para esquematizar por completo el modelado de la base de datos en base a

los resultados obtenidos.

Realizar el desarrollo del modelo lógico para tener una correcta

normalización de la base de datos y sus esquemas.

Crear el modelo E/R y funciones del proyecto MONOIL para que sean

consumidos desde las interfaces principales tanto para la lectura o escritura

sobre los registros que estarán en el repositorio de base de datos SQL.

9

Alcances del Problema

Se analiza los repositorios libres de la OMS, CEPAL, ITOPF, CEPALSTAT

para identificar la estructura en común y evaluar la información obtenida.

Se determina las variables adicionales que brinda los estudios obtenidos

sobre la contaminación petrolera en el Ecuador.

Junto a los investigadores del proyecto MONOIL se realiza un análisis de

aquellas variables tanto locales como globales que se producen por la

afectación del petróleo sobre el agua, tierra, aire y especies vivas.

Se realiza el Esquema Macro en la herramienta Excel con todas las variables

encontradas.

Se utiliza el simulador del Modelo Lógico utilizando la herramienta Navicat

para PostgreSQL (tomar versión de pruebas).

Para obtener una correcta normalización de la base de datos se utiliza el

procedimiento de programación Pascal Casing usado frecuentemente para

las Nomenclaturas en Java, Sql server.

Se realiza sobre la Herramienta PostgreSQL 9.3 en donde se manejarán

roles y permisos hacia las tablas para tener controles a nivel de seguridad.

Se utiliza la Herramienta Navicat para elaborar el Modelo de E/R de la base

de datos en el proyecto MONOIL.

10

JUSTIFICACIÓN E IMPORTANCIA DE LA INVESTIGACIÓN

La elaboración de una estructura correcta de base de datos brinda una gran

ventaja para los investigadores por la manera en la que se pueden cruzar varios

temas y se encuentran en un mismo lugar de almacenamiento, estas bases de

datos netamente ambientales guardan un alto grado de homogeneidad debido a

la existencia de normas internacionales las cuales en conjunto con una variedad

de criterios creados permiten una mejor clasificación por cada tipo de información

ingresada (Gil Rivera, 1994).

Mediante el proyecto se hace uso de información real sobre cuáles son esos

factores del petróleo que afectan al medio ambiente en la región amazónica y

podremos obtener reportes, datos estadísticos por cada uno de las variables

encontradas para el agua, aire, tierra, y especies vivas, posteriormente son

analizadas junto con los miembros investigadores del proyecto de titulación

MONOIL.

Lo novedoso de este proyecto es la creación de un estándar en la estructura de

una base de datos ambiental que integre varios repositorios de base de datos en

una sola base, y como el software Libre en este caso PostgreSQL es muy útil para

el diseño, creación y manipulación de información de forma segura.

Actualmente los investigadores de MONOIL no tienen un solo lugar de

almacenamiento muchas veces son guardados en sus respectivos PC o en algún

lugar físico sin el respectivo cuidado que es necesario, para realizar consultas de

información en ocasiones se las realizaba a entidades externas, implementando

el proyecto de modelamiento de la base de datos los beneficios para MONOIL

traerá beneficios referente a gastos financieros ya que ahorraran más tiempo en

investigaciones y en el almacenamiento de información.

11

BENEFICIOS

Mejoras en el procesamiento de los datos

Agilidad en las consultas realizadas.

Ahorro de costos en software al ser base libre y flexible.

Competitividad y seguridad en la data de la institución.

Optimización de gastos operativos

12

CAPÍTULO II

MARCO TEÓRICO

ANTECEDENTES DEL ESTUDIO

Generalmente, durante las expropiaciones petroleras se produce un alto grado de

contaminación en zonas donde existen comunidades cercanas produciendo

catástrofes que conducen inevitablemente al deterioro gradual del ambiente que

lo rodea en forma directa como puede ser al suelo, agua, aire, y especies vivas de

la amazonia ecuatoriana y a sectores de la parroquia Dayuma de la provincia de

Orellana.

Dentro del programa de investigación interdisciplinario MONOIL (Monitoreo

ambiental, salud, sociedad y petróleo en Ecuador), no se cuenta con una Base de

Datos la cual ayude a los centros de investigación a almacenar la información y

minimizar costos al realizar nuevas investigaciones sobre la problemática de la

contaminación petrolera y de los indicadores socioeconómicos que provee la

CEPAL y OMS. El proyecto realizado es de mucha ayuda para los investigadores,

científicos o cualquier entidad gubernamental ya que podrán acceder a la

información de forma rápida y eficiente.

Los repositorios de datos han permitido mejorar las líneas de investigación y

oportunidades de desarrollo en base a los componentes del petróleo, en Cuba se

han utilizado software como Procite, Viscvery Somine, Ucinet y Microsoft Excel,

demostrando grandes proyecciones en etapa de investigación como la

recuperación mejorada del petróleo, la obtención de biogás y biodiesel y la

eliminación de metales pesados en el petróleo causado por los microorganismos,

considerándolo como un gran desarrollo con el propósito de mejorar la salud

humana, animal y los componentes del aire y agua. (Bonell Rosabal, 2009).

En el Ecuador existen repositorios de datos sobre el medio ambiente capaz de ser

actualizados anualmente permitiendo ser los únicos elementos que aborden los

temas principales como la pobreza, la salud, factores económicos, variables que

son desagregadas a nivel parroquial y provincial, zonas urbanas y rurales por

regiones. Con estos resultados se ha logrado determinar que la región amazonia

13

refleja una importante desventaja a nivel estructural sean por las viviendas o la

calidad de vida, si tomamos en cuenta la educación tienen un amplio avance

respecto a los últimos 10 años, en salud y en pobreza se acerca se acercan a los

índices promedios nacionales. (Bustamante & Jarrín, 2004).

En base a la gran cantidad de información que se procesa en base a las

investigaciones y la proveniente de otros repositorios de información como los

provistos por la CEPAL, y OMS se necesita un Gestor de base de datos potente y

que brinde la máxima prestación y escalabilidad posible, gran parte de los SGBD

(Sistemas Gestores de Base de Datos) cumplen con el paradigma relacional e

integran el lenguaje SQL(Structured Query Language) para la manipulación y

almacenamiento de los datos, con esta consigna estos sistemas no permiten la

consulta de datos definidos en base al paradigma temporal de base de datos,

ocupan más memoria y espacio físico que a lo largo del tiempo pude ocasionar

problemas de lentitud en el servidor donde repose la base de datos, el lenguaje

PostgreSQL es capar de incluir extensiones como el modelo TSQL2, TSQL

(Temporal Structured Query Language) y el 2 por tomar una parte del lenguaje

SQL2, en si es una extensión de este lenguaje de manipulación de datos. TSQL2

en el núcleo de PostgreSQL lo convierte en una arquitectura con una excelente

evaluación funcional, utilizando métodos de frecuencias sobre los datos

optimizando los tiempos de respuesta de manipulación. (Aguilera F. & Garcia M.,

2011).

El repositorio de base de datos por la cantidad de información que tiene y el

recurso que se toma por parte del servidor puede tener una serie de sistemas de

monitoreo de base de datos ya que escalable a cualquier sistema y lengua de

programación. Utilizando las correctas herramientas de monitoreo el administrador

puede no solo detectar problemas antes de que afecte al servidor durante la

operación, es decir puede prevenir a que ocurran estando en línea.

Existe el sistema de recopilación de datos y gráficos “Munin” enfocado

especialmente en el uso del gestor de base de datos PostgreSQL por su

14

flexibilidad y facilidad a la cual los desarrolladores y administradores pueden

agregar plugin específicos para el monitoreo de las necesidades y requerimientos

especiales de quien lo utilice, monitorea el servidor y genera estadísticas sobre el

funcionamiento como la memoria RAM, el disco duro y otros servicios, aparte de

ser una instalación muy simple plug and play y a la vez facilitando y optimizando

los recolectores de información. (Wolf Iszaevich, 2011)

PostgreSQL por la gran cantidad de información que se puede procesar y

consumir diariamente utiliza mecanismos, técnicas de minería de datos y de reglas

de inducción capaz de ser integrados en su núcleo aprovechando las ventajas de

ser un módulo completamente libre así se puede suplir cualquier deficiencia

respecto a su rendimiento, estos algoritmos pueden mejorar los tiempos de

respuesta de los datos en las consultas realizadas hacia la base de datos.

La minería de datos consiste en una técnica que obtiene los patrones o modelos

de datos a partir de una gran recopilación de información siendo capaz de ser

utilizado en cualquier entorno como en sistemas de educación, sistemas

financieros, procesos, políticas, ciencias sociales, estadísticas, es decir el

aprendizaje automático se aplican dependiendo del negocio al cual se aplica la

aplicación.

Entre las variedades de herramientas usadas en la base de datos existe un

método llamado minería de datos en donde podemos encontramos Weka

(Waikato Environment for Knowledge Analysis), un sistema multiplataforma fácil

de usar debido a sus herramientas gráfica, soporta diversas técnicas de minería

de datos como el agrupamiento, clasificación, visualización y selección logrando

obtener buenos resultados y un mejor análisis del conocimiento permitiendo

brindar una mejor comprensión de los datos. (Robles Aranda & R. Sotolongo,

INTEGRACIÓN DE LOS ALGORITMOS DE MINERÍA DE DATOS 1R, PRISM E

ID3 A POSTGRESQL, 2013).

15

FUNDAMENTACIÓN TEÓRICA

La protección a la Amazonía ecuatoriana es esencial para los pobladores

cercanos a esta región aumentando su tiempo de vida libres de enfermedades o

cualquier mal que ocasionen los desperdicios del petróleo o sus minerales,

aplicando oportunamente métodos sistémicos y apropiados podemos obtener los

diferentes factores que intervienen y afectan en la contaminación resolviendo los

problemas oportunamente, tomando en cuenta que hasta hace unos 5 años la

fuente esencial para la economía del país fue la exportación de crudo y sus

derivados, hasta aproximadamente una década las exportaciones del petróleo

eran de hasta un 66%.

A pesar de la bonanza que se mantuvo con el petróleo no se aplicaron las medidas

necesarias para el bienestar de los pobladores de la amazonia y de los

ecosistemas naturales esto ha durado casi 40 años, cuando se tuvo conocimiento

de los yacimientos en el ecuador especialmente en su amazonia en el país se

mencionaba que esto traería nuevos modelos tecnológicos, financieros y una

variedad de ingresos económicos que ayudarían con las deudas que contaba el

país. El inconveniente surgió cuando a pesar de la gran cantidad de exportaciones

siendo estas en gran volumen las divisas no ingresaban correctamente al país el

motivo es que la empresa encargada de la producción petrolera fue Texaco quien

se encargó de extraer gran parte de petróleo de los pozos con mayor índices de

exportación, pero estos contratos firmados y sin un ente regulador no beneficiaban

al país motivo que aprovecho Texaco para beneficiarse a sí mismo

económicamente y cometer irregularidades tanto legal como financieramente

posible por lo que actualmente sigue demandado en la corte de Sucumbíos, entre

los daños están el derramamiento de petróleo, contaminación en la selva

ecuatoriana, enfermedades graves hacia los pobladores cercanos.

A pesar de que estas empresas petroleras han aportado con tecnologías que

mejoren la extracción de este mineral, el país también se ha visto beneficiado de

regalías, impuestos a la renta, inversión social, infraestructura, los gobiernos

locales no contemplaron los efectos colaterales que conllevaron a estos índices

16

altos de afectación petrolera como el desplazamiento de los pobladores cercanos,

la contaminación al aire, tierra y a la salud.

A continuación, se detallan las fases de la industria petrolera:

Grafico # 1: Fases de la Industria Petrolera

Fuente: Fases de la industria Petrolera Elaboración por: Pedro Villafuerte Y.

Frente a las afectaciones producidas por las empresas petroleras en la selva

amazónica ecuatoriana surge el programa MONOIL cuyo objetivo es mejorar y

bajar a gran escala mediante el uso de estrategias en base a la recolección de

información utilizada los medios contaminantes de petróleo, realizar mediciones

constantes para mitigarlos, para realizar esta evaluación se toma en cuenta los

siguientes puntos de control:

Analizar los problemas socioeconómicos ocasionados por el petróleo sobre

las poblaciones cercanas a la selva ecuatoriana.

Análisis sociales para obtener las vulnerabilidades a niveles nacionales,

regionales, parroquiales y familiares.

En base a los resultados obtenidos implementar soluciones que hagan frente

a los impactos ocasionados.

Con la problemática presentada y el afán de tener un repositorio de datos del cual

se pueda saber cuáles son aquellos minerales contaminantes producidos por el

petróleo y sus derivados permitiendo obtener resultados idóneos y faciliten el

trabajo de los investigadores, así como de las encuestas o métodos estadísticos

más concretos y seguros con datos reales y que se puedan actualizar

17

constantemente. Se crea el repositorio de base de datos del proyecto MONOIL el

cual es elaborado en el Gestor de base de datos PostgreSQL por la gran potencia

que posee al momento de ser consumido por otros sistemas.

El objetivo del proyecto es construir una base de datos física funcional, así como

existen bases de datos para aplicaciones médicas, financieras, estudiantiles, de

control, petroleras, que logre gestionar los datos enviados o requeridos por los

investigadores del proyecto MONOIL. Gestor que pueda realizar en un

determinado tiempo todas las máximas consultas a la base de datos y a la vez se

pueda tener conocimiento del tiempo de respuesta desde y hacia su invocación a

la vez que no consuma tantos recursos por parte del servidor beneficiando a los

investigadores en el factor tiempo. (Díaz Silvera & Martínez Silva, 2010)

MONOIL (MONITOREO AMBIENTAL, SALUD, SOCIEDAD Y PETROLEO EN

ECUADOR)

Es un proyecto netamente investigativo entre Francia-Ecuador, cuyo principal

objetivo es analizar los impactos sean ambientales o socioeconómicos

ocasionados por la contaminación petrolera en el ecuador especialmente en su

amazonia ecuatoriana.

Entre sus objetivos se encuentran los siguientes:

1. Realizar cartografías de las zonas petroleras identificando las

vulnerabilidades/capacidades respecto a la contaminación ambiental.

2. Medición de los impactos ocasionados por los químicos presentes en los

Hap’s, metales pesados y todos esos contaminantes sobre el agua, tierra,

aire y especies vivas.

3. Analizar y entender los reglamentos referentes a las actividades petroleras

y ambientales.

4. Entender el funcionamiento de los contaminantes desde la afectación

ocasionada por los compuestos hasta los ocasionados en los humanos.

18

5. La implementación de un sistema innovador referente a la

descontaminación hacia el agua para el consumo humano.

MONOIL cuenta con una serie de procesos colectivos los que pueden contar con

encuestadores, sociólogos, médicos, economistas, modeladores. En el tiempo de

duración del proyecto se dictan una serie de seminarios hacia los pobladores de

las zonas afectadas para lograr hacer conciencia sobre los problemas

socioeconómicos y ambientales que produce la contaminación petrolera hacia sus

comunidades. (MONOIL, 2016).

SCRUM

Es un conjunto de procesos en el que se aplican una serie de buenas prácticas de

forma regular en el que se debe trabajar colaborada mente en equipo para obtener

los mejores resultados en el proyecto que se esté planteando. Con estas prácticas

el trabajo diario se vuelve más productivo.

Al aplicar esta metodología se deben realizar estrategias parciales y demostrar lo

aprendido durante cada etapa para lograr obtener las experiencias positivas o

negativas encontradas. También es usada en los entornos pequeños donde la

entrega de los proyectos debe ser en un corto periodo de tiempo y cuyos requisitos

sean cambiantes y altamente productivos. (Proyectos Agiles.org, 2016)

Se define a SCRUM como la colección de ciertos procesos para la correcta gestión

de proyectos de cualquier índole, permitiendo centrarse en una correcta entrega

del producto hacia el cliente y potenciar al equipo para lograr los objetivos

esperados en su máxima eficiencia utilizando un esquema de mejora continua

(Díaz, 2009).

19

Etapas de SCRUM

Planeamiento del Sprint/Sprint Planning. - Todos los miembros del

proyecto se reúnen para definir los sprint (Unidad básica de trabajo) a utilizar

en el proyecto, y asignar un tiempo estimado.

Reunión del equipo del SCRUM. - Reuniones diarias con un máximo de 15

minutos en donde se deben compartir experiencias de lo elaborado.

Refinamiento del Backlog. - El dueño del proyecto revisa las tareas con el

fin de darles un peso y resolver cualquier duda presentada.

Revisión del Sprint. - todos los miembros del equipo se reúnen para

demostrar cada tarea resuelta.

Retrospectiva del Sprint. - Reunión entre el dueño, líderes y equipo de

trabajo para tratar los eventos ocurridos en cada Sprint.

Base de Datos

Base de datos es un sistema en el cual se pueden almacenar gran cantidad de

datos en disco para luego ser gestionada, consultada fácilmente mediante

diferentes usuarios o programas sin que existe algún problema de sobrecarga. En

sí es el uso de cualquier mecanismo que almacena información en equipos

remotos y permite compartir datos en la red.

Las bases de datos se conforman de una o varias tablas que almacenan un

conjunto de datos. Estas tablas contienen columnas y filas que conforman los

registros, conjuntos de datos son explotados por los sistemas de información de

las empresas.

Características de una Base de datos

Control en redundancia

Manejo de Concurrencia por la cantidad de usuarios que acceden al servidor.

Independencia entre los datos.

20

Optimización en las consultas realizadas, llegando a ser complejas y no

complejas.

Tablas de Auditoria y Control de Acceso.

Uso de un lenguaje estándar para gran parte de sistemas gestores de base

de datos SQL.

Normalización de una Base de datos

Es un conjunto de procesos en el cual datos complejos se estructuran para

convertirse en datos más pequeños para que sean más simples y fáciles de

acceder. Estas técnicas o reglas son usadas por los diseñadores de bases de

datos para tener como resultado final un esquema físico que minimice los

problemas de lógica presentados y no presente errores de manipulación de datos.

Una base de datos no normalizada termina ocupando más espacio que una no

normalizada por la cantidad de datos redundantes que suele utilizar provocando

más lectura sobre el disco y mayor uso de memoria (mysql-hispano, 2003).

Para el uso de estas reglas es necesario el uso de cada una de estas existen 5

normas, pero las más utilizadas son las 3 primeras.

1. Primera Forma Normal (1FN)

2. Segunda Forma Normal (2FN)

3. Tercera Forma Normal (3FN)

4. Cuarta Forma Normal (4FN)

5. Quinta Forma Normal (5FN)

Primera Forma Normal (1FN)

Elimina aquellos grupos de datos repetitivos de cada tabla presente en el

modelo relacional.

21

Creación de tablas separadas por los grupos relacionales presentes.

Identificar cada grupo relacional con claves primarias.

Segunda Forma Normal (2FN)

Si en una tabla existen registros en varias columnas que cumplen la misma

funcionalidad es recomendable crear varias tablas.

Estas tablas divididas se las debe relacionar con una clave externa.

Tercera Forma Normal (3FN)

En caso de existir campos dentro de la tabla con datos que no dependan

en gran parte de la clave única es recomendable eliminarlos.

Se debe eliminar toda clase de dependencia transitiva en caso de ser

necesario.

Cuarta Forma Normal (4FN)

Se generan las relaciones externas usando otras tablas.

Entidades independientes de relaciones varios a varios no puedes estar

coexistiendo en la misma tabla.

Quinta Forma Normal (5FN)

Muchas veces se la llega a representa como una cuarta forma normal e

indica que toda dependencia join debe estar implicada por claves

primarias.

El uso de los procesos de normalización hacia la base de datos nos brinda

modelos más robustos, flexibles ante cualquier cambio en la lógica de negocio que

se vaya utilizar, favoreciendo las etapas transitivas de diseño hacia la de

22

implementación. También contribuye con un tiempo de desarrollo más corto en los

sistemas que lo vayan a consumir por la gran cantidad de información a procesar.

“La integración del proceso de normalización con los SGBD permite desarrollar

modelos robustos, eficientes, con mayor nivel de flexibilidad ante cambios

introducidos en el negocio” (Espinal Martín & Puebla Martínez, 2010).

Modelo Estrella de una base de datos

El modelo utilizado para la creación de estas estructuras de base de datos es el

de Estrella, “constituido especialmente por un conjunto de tablas llamadas

dimensiones y asocian toda su información a una tabla de hechos” (Fuentes Tapia,

2010). Los datos obtenidos deben alimentar constantemente a su estructura

principal esta será la de mayor carga transaccional de esta manera alivia el uso

de datos por acceso a múltiples tablas evita la cardinalidad y los cuellos de botella,

el uso de estos modelos también aplica para la migración de catálogos.

Sistema de Gestión de Base de Datos

Los SGBD son un tipo de Software que permiten la manipulación, creación entre

el usuario o software y la base de datos, para esto se hacen valer de algún

lenguaje informático que permita la manipulación de datos, así como el de

consultas.

Grafico # 2: Sistema de Gestión en una Base de Datos

SGBD

Modelo Relacional

Estructura de datos

Se compone

Se basa

Fuente: Sistema de Gestión de BD. Elaboración por: Pedro Villafuerte Y

23

Ventajas sobre la gestión de la base de datos.

Control sobre la redundancia de datos.

Consistencia de datos.

Compartir datos.

Mantenimiento de estándares.

Mejora en la integridad de datos.

Mejora en la seguridad.

Mejora en la accesibilidad a los datos.

Mejora en la productividad.

Mejora en el mantenimiento.

Aumento de la concurrencia.

Mejoras en servicios de copias de seguridad.

Desventajas de un SGBD

Complejidad.

Coste de equipamiento adicional.

Vulnerable a los fallos.

Modelos Entidad-Relación en una base de datos

Denominado por sus siglas ERD “Diagram Entity Relationship” es un diagrama

que mediante el modelado de datos junto con relaciones establecidas de un

sistema muestran el comportamiento de un conjunto de datos, permiten expresas

entidades relevantes e inter-relaciones, en base a este modelo podemos definir el

esquema adecuado para el gestor de base de datos.

24

Elementos del modelo Entidad-Relación

Entidad: Son las representaciones que se les da a los objetos utilizados, los

cuales tendrán cierta información necesaria para mantener las relaciones

establecidas, en representaciones gráficas se lo hace mediante un

rectángulo.

Atributos: Definen o identifican a la entidad, cada una de estas puede llegar

a tener distintos atributos. Cada entidad puede llegar a tener distintos

atributos, de esta manera es como logra ser identificada, están

representados mediante círculos y se puede mostrar solo las entidades

importantes. Los atributos están asociados a los tipos de clave que

describimos a continuación:

Clave Primaria: son aplicados a un único atributo que identifica a la

entidad.

Clave Foránea: se forma utilizando la clave primaria de otra entidad.

Súper Clave: se crea cuando un conjunto de atributos forma un único

atributo clave.

Relación: Indica la relación que se puede dar entre una o varias entidades

que tengan determinados atributos en común, las relaciones que se utilizan

en un esquema de base de datos están detalladas de la siguiente manera:

Relación uno a uno: una instancia de la tabla X se relaciona con una

instancia de la tabla Y.

Relación de uno a muchos: una instancia de la tabla X se relaciona con

varias instancias de la tabla Y.

Relación muchos a muchos: cualquier instancia de la tabla X se

relaciona con cualquier instancia de la tabla Y.

25

Características de una base de datos

Controla la redundancia de datos: controla que los datos no se repitan, sean

consistentes y no desperdicien memoria, de esta manera no tiene datos

duplicados, pero si con alguna relación.

Integridad de los datos: creación de reglas que impida datos erróneos.

Seguridad: Se define la gestión de los roles necesarios para controlar los

usuarios sin los privilegios necesarios hacia la base de datos.

Accesibilidad: gestiona la cantidad de usuarios que acceden a la base de

datos de forma continua, evita que se formen cuellos de botella.

Respaldo y Recuperación: Respaldos y Backup constantes sobre la base de

datos como estándar se pide que sea de cada 3 meses, con esto se evita

futuras pérdidas de información.

PostgreSQL y su funcionalidad

PostgreSQL es actualmente uno de los mejores gestores de base de datos de

código abierto en la actualidad, trabaja basándose en el modelo objeto-relación y

se encuentra distribuido bajo licencia BSD permitiendo que su código fuente sea

libremente distribuido, debido a sus constantes actualizaciones y la seguridad

implementada es utilizada para el desarrollo de sistemas comerciales.

Gracias a su página wiki al cual se realizan publicaciones constantemente

evidencia la gran cantidad de usuarios, organizaciones y compañías que lo utilizan

a nivel global, desde sus inicios hasta la actualidad PostgreSQL lleva 20 años en

el mercado demostrando solvencia y sobretodo madurez en su desarrollo.

PostgreSQL maneja un Core que iguala y hasta supera en características,

funcionalidades, seguridad, estabilidad y potencia a otros gestores de base de

datos privados y gratis.

El nivel estructural que utiliza PostgreSQL es cliente/servidor utilizando

multiprocesos para evitar fallo alguno en cada proceso que puede estar

26

ejecutando de esta forma evita el daño de información y puede seguir teniendo

continuidad.

Grafico # 3: Componentes del Sistema PostgreSQL

Aplicación cliente: Es el cliente que se conecta a la base de datos y puede

gestionar, administrar su contenido, la conexión la logra mediante varios medios

como el TDP/IP.

Demonio postmaster: Es el proceso principal encargado de escuchar las

peticiones de los clientes utilizando un puerto seguro de conexión a la vez crea

procesos capaces de validar estas peticiones, las gestiona y las consulta para

devolver el resultado hacia el cliente.

Fuente: Componentes del sistema PostgreSQL Elaboración por: Pedro Villafuerte Y.

Aplicación

Cliente

Conexión Inicial

Administrador

de

Almacenamient

Autenticación,

Consultas y resultados

Administrador de

Correos Servidor de PostgreSQL

a nivel Backend.

Compartición de Buffer

Disco

27

PostgreSQL share buffer cache: Es la memoria que se utiliza para almacenar

los datos en la cache del servidor y agilitar las consultas a la base de datos.

Disco: Es la unidad física donde se almacena la información gestionada y los

datos por default necesarios para el correcto funcionamiento de PostgreSQL.

El comienzo de PostgreSQL

IBM en la década de los 70 mantenía la idea de la potencia que podría brindar las

bases de datos relacionales. Así nació el primer lenguaje estructurado SQL

(Structured Query Language) bajo el nombre del proyecto “System R”, su diseño,

características, algoritmos fueron la influencia de otros gestores de base de datos.

Uno de esos gestores de datos denominado Ingres (Interactive Graphics Retrieval

System) el cual aportaba con la idea de la potencia de las bases de datos

relacionales y que sea de código libre para darle más escalabilidad y se

implementen mejoras, incluso en la década de los 80 su evolución le permitió ser

el origen para otras bases de datos como NonStop, Sql, Sybase, Informix.

En los años 85 el creador de Ingres Michael Stonebraker lidero un proyecto en la

Universidad de Berkeley al cual lo llamo Postgres el cual tenía el apoyo de la

grandes organizaciones públicas y privadas de EEUU, con la experiencia obtenida

de Ingres y su afán de obtener un sistema capaz de superar a su primera creación,

pero con un nuevo enfoque y libre del código fuente anterior se planteó los

siguientes objetivos.

Brindar un mejor soporte.

Brindar métodos de acceso, operadores y tipos de datos más robustos.

Creación de tipos de datos autoejecutables.

La implementación de funcionalidades capaz de auto sustentar la base de

datos frente a una caída y que esta no afecte los datos, mejoro los sistemas de

backup.

28

La implementación de un lenguaje de consulta mucho mejor a Ingres

denominado POSTQUEL.

Postgres95 en el mundo Open Source

Ya en la década del 94 en la versión 4.2 de Postgres se empezó a trabajar en el

código quitando muchos objetos los cuales no eran necesarios, se quitaron los

errores y se hicieron mejoras volviéndolo más rentable.

Se mejoró la interfaz Objeto-Relación.

Se utilizó un mejor interpretador del lenguaje POSTQUEL.

Se implementaron las funciones capaces de ser interpretadas por el lenguaje

SQL.

Se implementó un pequeño manual para hacer más fácil la interpretación por

los usuarios y se pueda distribuir su información.

Fue publicado en la GNU Make.

Esta versión la 1.0 fue publicado 1 año después de su creación fue desarrollado

en ANSI C superando hasta en un 50% a Postgres convirtiéndolo en un gestor

potente, publicado bajo la licencia BSD y al ser libre nacieron más colaboradores

con el proyecto y su popularidad creció aún más.

PostgreSQL 1996 En la Actualidad.

Debido a la falta de tiempo de los creadores de Postgres95 los usuarios con más

conocimiento de este gestor tomaron la batuta del proyecto y crearon un grupo al

cual llamaron “Postgres95 Global Development Team”, este grupo de

colaboradores de aproximadamente 6 miembros decidieron cambiar el nombre del

proyecto a PostgreSQL lanzándolo en el año 1997 convirtiéndolo en la versión 6.0,

proyecto al cual le añadieron muchas funciones al grupo las cuales incluían:

Planificación en la liberación de los códigos actualizados.

Se convirtieron en los responsables únicos de las actualizaciones o novedades

de PostgreSQL, o algún tipo de anuncio político.

29

Se dividieron las responsabilidades como los permisos de las consultas SQL,

cambios en la estructura, modificaciones en el código fuente, etc.

Las actualizaciones o publicaciones nuevas eran supervisadas y discutidas

para validar si eran necesarias o no.

Este grupo ha crecido considerablemente en los últimos años colaborando con

numerosas ideas relacionadas al proyecto, brindando soluciones que alivien los

problemas, la carga de información que rentabilice los servicios de PostgreSQL,

verifican el funcionamiento realizando test, control de versiones en los servidores

y mantienen discusiones sobre las nuevas funcionalidades a implementar,

también alimentan la base de conocimiento para ser distribuido libremente y

aumentar la cantidad de participantes, la forma en como este proyecto está a flote

es gracias a la cantidad de empresas públicas y privadas que colaboran

económicamente con la mejora de PostgreSQL ya que esto también los beneficia

a ellos por el costo que lleva tener un gestor de base de datos licenciado, es por

eso que en los últimos años este gestor se ha dedicado a mejorar su velocidad de

procesamiento que es lo más esencial en una empresa.

Versiones de PostgreSQL

Cuadro #2: Versiones de PostgreSQL

Fecha de Lanzamiento Versión

1995/05/01 1.0

1997/01/29 6.0

1997/06/08 6.1

1997/10/02 6.2

1998/03/01 6.3

1998/10/30 6.4

1999/06/09 6.5

2000/05/08 7.0

2001/04/13 7.1

2002/02/04 7.2

2002/11/27 7.3

2003/11/17 7.4

2005/01/19 8.0

2005/11/08 8.1

2006/12/05 8.2

2008/02/04 8.3

30

2009/07/01 8.4

2010/09/20 9.0

2011/09/12 9.1

2012/09/10 9.2

2013/09/09 9.3

2014/12/20 9.4

2016/02/10 9.5

Fuente: https://2ndquadrant.com/es/postgresql Elaborado por: Pedro Villafuerte Yagual

Estabilidad de PostgreSQL

Actualmente PostgreSQL tiene disponible la versión beta 9.6 pero la más rentable

y escalable de la actualidad es la versión 9.5 el cual muchos usuarios y

desarrolladores la describen como la más potente de la actualidad cumpliendo con

los estándares de una base de datos comercial global, en las últimas versiones se

han ido mejorando el uso de funciones que aumente la rentabilidad de las

consultas a la base de datos y que estas respuestas se ejecuten en el mínimo

tiempo posible, entre los estándares actuales están la creación de índices,

particiones de tablas, particiones por fechas, Funciones, tablas de auditoria, tablas

de rendimiento, diccionario de datos, mejoras de cobertura, rendimiento,

desempeño, fácil al momento de ser invocado por otros lenguajes de

programación y soporte nativo para JSON.

Características

Las características principales de PostgreSQL en la actualidad son las siguientes:

Permite la concurrencia evitando bloqueos al momento de realizar consultas

desde varias instancias.

Actualización constante en base al estándar SQL.

Actualización y creación de nuevos drivers para el manejo del esquema

Cliente/Servidor.

31

Mejoras en el rendimiento para las consultas pesadas utilizadas por grandes

empresas.

Capaz de incluir en su Core nuevos plugins que mejoren su escalabilidad.

Capaz de ser usado en muchos tipos de aplicaciones sin importar su lenguaje

de programación.

Creación de funciones de Compatibilidad que permita la importación de otros

gestores de base de datos.

Optimización en índices y en las funciones de agregación.

Fácil configuración y gran rendimiento para varias aplicaciones.

Actualización constante en los drivers de conexión a Java, Python, php, etc.

Manejo de alta Disponibilidad.

Actualización en los tipos de datos utilizados, capaz de ser usados para

informaciones geográficas, petroleras, estudiantiles, medicinales.

Uso de Exclusión por Restricciones o Particionamiento de Tablas para evitar

el recorrido de varias tablas.

Inclusión de los roles de base de datos.

Rendimiento y escalabilidad mejorados

PostgreSQL no se queda atrás en el uso de las nuevas técnicas de desarrollo en

las bases de datos, uso de índices, gestión y análisis sobre tablas ya usadas,

particiones, optimización en la escritura de los datos, técnicas que optimizan los

recursos disponibles en los servidores, estas ventajas y mejoras en cuestión de

rendimiento permiten que la sobrecarga de información sea en volúmenes muy

altos, se puede tomar en cuenta los siguientes detalles:

Capaz de ajustarse al número de procesadores y a la memoria que posean

estos servidores, este nivel de arquitectura le permite soportar múltiples

peticiones en forma simultánea.

32

Funcionamientos en cascada para tablas de mayor carga transaccional

escalados horizontalmente.

Las consultas a los datos se realizan mediante el uso de índices.

Puede llegar a realizar 350.000 lecturas sobre la base por cada segundo.

Ahorro de energía por parte del servidor al no disponer de tantos servicios

inservibles.

Soporta hasta 2 Terabytes de RAM en equipos de 64 bits.

Mejoras en el GiST (Árbol de Búsqueda Generalizado), permitiendo

concurrencia, rendimiento y velocidad.

Empresas que lo usan.

Existen un sin número de empresas que utilizan PostgreSQL por su flexibilidad y

robustez como lo son: American Chemical Society, NASA, University of Alabama,

University of California, University of Sydney, Laboratorio Nacional de Física de la

India, LAMP, Safeway, Apple, Skype, Cisco, Red Hat, etc.

El Core libre disponible de PostgreSQL permite que muchos desarrolladores

implementen aplicaciones sencillas, financieras, políticas, es algo que otros

gestores de base no lo utilizan.

Ventajas de PostgreSQL

Al ser un sistema estable con altos índices de prestaciones y rendimiento capaz

de funcionar en la mayoría de los sistemas operativos e integrarse fácilmente, con

esta particularidad se puede acoplar a cualquier sistema generado por los

desarrolladores, entre el sinnúmero de ventajas detallamos las siguientes:

Posee una instalación ilimitada en cuanto al número de servidores que la

utilicen.

Rentabilidad al momento de ser ejecutado vía Web.

Fácil de Administrar.

33

Soporte disponible constantemente para las empresas.

Posee una interfaz amigable

Multiplataforma.

Capacidades de replicación de datos.

Desventajas

Se abortan las transacciones ante el fallo en la ejecución de fuentes o tablas

en PostgreSQL, internamente se crean puntos de restauración en la base,

pero esto provoca lentitud en los servidores.

PostgreSQL es más lento en comparación con MySQL.

No tiene un soporte oficial en línea, los documentos o ayudas son parte de

los colaboradores.

PostgreSQL consume más recursos que el gestor de base MySQL.

Sintaxis de comandos no tan amigables.

Estándares para el desarrollo de la Base de datos

Los estándares de desarrollo son un conjunto de reglas proporcionadas hacia los

sistemas más usados permitiendo dar un orden y entendimiento más explícito

sobre lo desarrollado, para esta definición se puede tomar en cuenta los siguientes

aspectos:

Fácil interacción entre la aplicación y el desarrollador.

Optimización del código elaborado permitiendo al desarrollador saber en qué

parte del desarrollo elaborado se encuentra, y detectar los problemas

fácilmente.

Permite la elaboración de una correcta estructura, así como la optimización

de los componentes en caso de prestarse a actualizaciones constantes.

34

Cumplimiento de normas permitiendo dar un toque más elegante al código

elaborado.

Identificar los aspectos visuales, diseño, código fuente entre diferentes

gestores de base de datos.

“Tomando en cuenta estas definiciones se pueden obtener un sistema óptimo y

escalable y la interacción con el desarrollador o los usuarios sea más elegante sin

contradicciones o pérdidas de tiempo”. (Greguas Navarro & Hernández Claro,

2010).

Para PostgreSQL no existe un conjunto de estándares que permitan interpretar y

elaborar su código fuente para brindar una experiencia más atractiva hacia los

usuarios, para evitar estos inconvenientes se usan las anotaciones las cuales

pueden ser utilizada para el desarrollo tanto de sistemas informáticos como de la

base de datos entre las más populares se encuentran:

Notación de Pascal (Pascal Case).

Notación Camello (Camel Case).

Notación Húngara.

Notación de Pascal (Pascal Case)

Esta anotación nos indica que las variables pertenecientes a la base de datos

deben tener como identificador la primera letra en mayúscula seguido de las

letras en minúscula.

Pais, Alumnos

Si la palabra es compuesta la primera letra de cada palabra debe ir en

Mayúscula.

RegionPais, PaisAlumnos

Deben ser nombres claros.

35

En caso de la base de datos estos detalles aplican para los nombres de las

tablas, campos, procesos, funciones, vistas, triggers.

Fn_ActualizaRegionPais, Fn_IngresaPaisAlumnos

Notación de Camello (Camel Case)

Esta anotación nos indica que las variables pertenecientes a la base de datos

deben tener como identificador la primera letra en Minúscula seguido de las

letras en minúscula.

Si la palabra es compuesta la primera letra de la primera palabra debe ir en

minúscula y las primeras letras de las siguientes palabras deben ir en

Mayúsculas.

regionPais, nombreProfesor

Deben ser nombres claros.

En caso de la base de datos estos detalles aplican para los nombres de las

tablas, campos, procesos, funciones, vistas, triggers.

Fn_actualizaRegionPais, Fn_ingresaPaisAlumnos

Notación Húngara

Este estándar se lo utiliza con más frecuencia para la identificación de las variables

en determinados proyectos, para su identificación se toman en cuenta los

siguientes puntos:

Consiste en un prefijo que se le asigna a cada tipo de dato de la variable, el

prefijo debe estar en minúscula y la variable debe comenzar con mayúscula y

las demás letras en minúscula.

Si es palabra compuesta, cada palabra debe comenzar en mayúscula.

36

Cuadro #3: Notación Húngara como estándar de una base de datos

Tipo de Dato Prefijo Ejemplo

Integer int intCodigoPais

Boolean bln blnExiste

Character Chr chrBandera

Date dt dtFechaIngreso

Fuente: Notación Húngara como estándar de una base de datos Elaborado por: Pedro Villafuerte Yagual

“Estos estándares también aplican para las variables internas del proyecto es decir

para aquellas usadas en funciones, vistas, triggers, aplicando estas

recomendaciones podemos mejorar la legibilidad de un proyecto, logrando

identificar los componentes y diferenciarlos rápidamente optimizando tiempo y

recursos.” (López Takeyas, 2016)

Para nuestro desarrollo vamos a considerar la Notación de Pascal ya que es una

de la más utilizada para las bases de datos SQL, de esta manera brindaremos un

código más limpio, entendible y ordenado.

Optimización y Rendimiento en PostgreSQL

Dada la cantidad de transacción que se puede llegar a generar en un determinado

tiempo afectando con la performance del servidor de base de datos. Se crean los

métodos de optimización y rendimiento que facilitan las consultas realizadas sobre

la base de datos, la optimización consiste en el sistema de evaluación sobre las

consultas a la base de datos para encontrar las estrategias posibles que vuelva

más eficiente su costo y convertirlo en otra subrutina dada.

Utilizando algoritmos relacionales intenta obtener una expresión equivalente

de la expresión dada.

En base a las estrategias se obtiene la más acorde a nuestra base de datos.

Selección del algoritmo más acorde a la operación.

Análisis y uso de los índices necesarios a utilizar.

37

Grafico # 4: Funcionamiento del optimizador de Consultas

Grafico 4. Funcionamiento del optimizador de Consultas Elaboración: Pedro Villafuerte Y.

En la selección del costo más óptimo para nuestros procesos se debe tomar en

cuenta que los índices cambian su plan de ejecución a medida que la tabla usada

aumente su tamaño, recomendables es hacer un análisis de estos tipos de tablas

cada 500000 registros nuevos.

Estimación de estadísticas

El costo usado en cada consulta puede depender también de cada su consulta ya

que pueden ser los causantes del aumento de las estadísticas. Se podría decir

que de una expresión “x=(y=z)” para obtener una estimación de su costo se debe

primero evaluar la expresión “(y= z)” optimizar esta consulta y con este resultado

agregarlo a la expresión “x”.

El costo de una consulta hacia la base de datos depende ciertos factores:

Tiempo de acceso al sistema E/S

Volumen de datos.

Organización Física.

Sentencia SQL

Estandarización

Optimización

Compilación

Rutina de acceso a datos

Resultados

38

Tamaño de buffers en memoria.

Tiempo de procesamiento del CPU

Para bajar el costo a las consultas se debe tomar en cuenta los siguientes factores.

Reducción al sistema de E/S

Reducir los accesos intermedios.

Acceso por los atributos indexados.

Reducción de los procesamientos del CPU

Ahorrar tiempo de procesamiento en la selección de expresiones.

Simplificación de expresiones usando algoritmos matemáticos.

Las expresiones matemáticas nos permiten identificar las consultas enviadas, en

el cual mediante suposiciones se puede alterar la consulta para reducir su costo.

Simplificando la expresión después del Where quedaría:

X ˅ Y~ ˄ (Y ˅ Z) ˄ Z~ = X ˅ ((Y~ ˄ Y) ˅ (Y~ ˄ Z)) ˄ Z~

X ˅ (Y~ ˅ Z) ˄ Z~ = X ˅ ((Y~ ˄ Z~) ˄ (Z ˄ Z~)) = 0

Select ciudad from vendedores Where nombre = ‘PEDRO’ -> variable X Or not (ciudad = ‘QUITO’) -> variable Y And (ciudad = ‘QUITO’ or ciudad = ‘AMBATO’) -> variable Z And not (ciudad = ‘AMBATO’);

39

La expresión quedaría de la siguiente manera:

Entre las equivalencias lógicas tenemos:

Conjunciones y Negaciones

a ˄ ¬a = falso a ˅ ¬a = cierto a ˄ falso = falso a ˅ falso = a a ˄ cierto = a a ˅ cierto = cierto

Leyes de Morgan

¬ (a ˄ b) = ¬a ˅ ¬b ¬ (a ˅ b) = ¬a ˄ ¬b

Implicación

A -> b = ¬a ˅ b

Cuantificadores

∀𝑥 ∙ 𝑃 𝑥 ≡ ∄𝑥 ∙ ¬𝑃 𝑥 ∀𝑥 ∙ ¬𝑃 𝑥 ≡ ∄𝑥 ∙ 𝑃 (𝑥)

Equivalencias en Algebra relacional

Distribución de la selección sobre el Join

𝜎𝑐r∧ 𝑐s (𝑅 ⋈ 𝑆) ≡ 𝜎𝑐r(𝑅) ⋈ 𝜎𝑐s(𝑆) Donde cr sólo incluye atributos de R y cs sólo de S. Distribución de la proyección sobre el Join

Π𝐴r∪𝐴s (𝑅 ⋈ 𝑆) ≡ Π𝐴r∪𝐴s (Π𝐴r∪𝐴⋈ (𝑅) ⋈ Π𝐴s∪𝐴⋈ (S)) Donde AR sólo incluye atributos de R, AS sólo de S y A ⋈ los atributos sobre los que se realiza el join.

Mediante estas proyecciones y operaciones matemáticas minimizamos el impacto

de las consultas vs el coste que pueden tomar, así como los siguientes puntos:

Reducción de impacto en operaciones en el uso de los joins.

Eliminar resultados redundantes, aplicando proyecciones en cascada.

Restricción en el uso de distinct, not in, not exists (evita resultados iguales).

Select ciudad from vendedores Where nombre = ‘PEDRO’;

40

Información del catálogo del SGDB

Toda la información descriptiva, completa que se genere de la estructura de una

base de datos es usada por el SGBD en donde lo almacena como un catálogo o

diccionario de datos, puede llegar a almacenar:

Los tipos de datos y sus elementos

Mapeo relacional entre los esquemas

Información sobre el archivo y sus propiedades.

Detalla la información almacenada.

Detalla la información de los usuarios creados junto con sus roles.

Toda información descriptiva almacenada se denomina meta datos, cuyo fin es

saber que datos ya existen en la base y poder acceder a ellos de una forma más

rápida, se podría decir que es la memoria cache de una base de datos.

Entonces cada vez que se requiera hacer una consulta sobre una tabla del DBMS

realiza una secuencia de pasos:

Verifica el catálogo del sistema para ver si tiene una estructura similar a la

que se está enviando.

El catalogo le indica en donde se puede encontrar la consulta (valida la

cantidad de byte que tenga la información).

Con los datos obtenidos accede al fichero o su información, realizando una

consulta más rápida.

41

Cuadro #4: Catálogos de PostgreSQL

Nombre Catalogo Propósito

Pg_aggregate funciones de agregado

Pg_am métodos de acceso de índice

Pg_amop operadores del método de acceso

Pg_amproc Procedimientos de soporte del método de acceso.

Pg_attrdef los valores por defecto de columna

Pg_attribute columnas de tablas (“Atributos”)

Pg_authid identificadores de autorización (“Roles”)

Pg_auth_members relaciones de miembros identificadores de autorización

Pg_cast conversión (conversiones de tipos de datos)

Pg_class tablas, índices, secuencias, vistas (relaciones)

Pg_collation colaciones (información de localización)

Pg_constraint restricciones de comprobación, restricciones únicas, restricciones de clave principal, las restricciones extranjeras

Fuente: https://www.postgresql.org/docs/9.3/static/catalogs.html


Los catálogos en PostgreSQL son tablas que pueden ser modificadas, eliminadas,

actualizadas, este gestor utiliza comandos especiales SQL en caso no se quiera

acceder a de forma manual a estos catálogos, un ejemplo es el comando CREATE

DATABASE que se encarga de insertar filas en el catálogo pg_database, también

los crea físicamente.

Esquemas en Base de Datos.

Un esquema es un contenedor de tablas, vistas, procesos, funciones y objetos

usados en una base de datos, los almacena en un espacio físico dentro del

servidor para ser exportado a otros equipos de ser necesarios, esto facilita la

subida de objetos a otros ambientes como desarrollo o producción. Un esquema

de una base de datos contiene una o más bases asociadas, incluso distintos

usuarios y esquemas pueden acceder entre sí. Los objetos que se encuentran

dentro de cada esquema pueden llevar el mismo nombre sin afectar a los modelos

de E/R.

https://www.postgresql.org/docs/9.3/static/catalogs.html

42

Gran parte de los gestores de bases de datos mantienen una estructura relacional

en la cual almacenan gran cantidad de información esencial para las empresas,

ante esta necesidad se crea el paradigma de transformación de esquemas el cual

aún es un tema de investigación para los administradores de BD, a pesar de las

variedad de herramientas que se crean día a día para optimizar estos procesos se

mantienen ciertos problemas en cuestión de rendimiento, para estos problemas

se utilizan modelos matemáticos que optimicen el uso de los esquemas, lograr

que los usuarios que accedan al esquema mediante varios caminos puedan tener

la información de la manera más rápida posible. (Desiré Atangana & Sepúlveda

Lima, 2007)

Entre las razones por las que utilizamos esquemas tenemos las siguientes:

Múltiples usuarios puedan trabajar en sus propios modelos de E/R sin afectar

los datos de otros usuarios.

Organizar los objetos del modelo E/R en grupos, subcarpetas que puedan ser

manipulados en otros ambientes.

Evitar interferencias entre las aplicaciones que quieran acceder a la base de

datos

Se guardan en direcciones físicas en el servidor, es decir no pueden anidarse

en el Sistema Operativo.

FUNDAMENTACIÓN SOCIAL

MONOIL es un proyecto que tiene como objetivo restituir los derechos a las

sociedades impactadas por las actividades petroleras y reducir los daños sociales

y ambientales como lo ampara la Constitución Política.

Tratará de evaluar la contaminación ambiental en la Amazonia ecuatoriana, así

como en los sitios de la refinería cercanos a estas zonas, el impacto positivo o

negativo de la actividad petrolera en el desarrollo de los territorios ocupados y las

vulnerabilidades y disposiciones sociales que hay que enfrentar a diferentes

niveles de acción (nacional, regional, parroquial, familiar).

43

Los levantamientos de la información para elaborar estos informes no son

resguardados en una Base de Datos segura, con el proyecto que se presenta se

ayudara a los organismos involucrados dentro del proyecto MONOIL a acceder de

manera rápida a la información que necesiten para las diferentes investigaciones.

(Monoil / IRD - Monoil, 2016).

FUNDAMENTACIÓN LEGAL

El presente proyecto se fundamenta en los siguientes artículos los cuales se

encuentran especificados en la Constitución de la República del Ecuador y en el

Convenio de Colaboración e investigación entre el IRD, Ministerio del Ambiente y

PRAS para la realización conjunta de un estudio llamado MONOIL.

El Estado Ecuatoriano garantiza, apoya y promueve, en los estudiantes de

educación superior, la investigación científica y tecnológica y así promover

soluciones para los diferentes problemas del país. Se detallan en los siguientes

artículos:

Decreto 1014

Sobre el uso del software libre

En base al uso del software libre las políticas actuales decretadas por el gobierno

de la republica del ecuador se mencionan los siguientes artículos. (Secretaria

Nacional de la Administracion Publica, 2016)

Art. 1: Establecer como política pública para las entidades de administración

Pública central la utilización del Software Libre en sus sistemas y equipamientos

informáticos.

Art. 2: Se entiende por software libre, a los programas de computación que se

pueden utilizar y distribuir sin restricción alguna, que permitan el acceso a los

códigos fuentes y que sus aplicaciones puedan ser mejoradas.

Estos programas de computación tienen las siguientes libertades:

44

Utilización de programa con cualquier propósito de uso común.

Distribución de copias sin restricción alguna.

Estudio y modificación de programa (Requisito: código fuente disponible)

Publicación del programa mejorado (Requisito: código fuente disponible)

Art. 3: Las entidades de la administración pública central previa a la instalación

del software libre en sus equipos, deberán verificar la existencia de capacidad

técnica que brinde el soporte necesario para este tipo de software.

Art. 4: Se faculta la utilización de software propietario (no libre) únicamente

cuando no exista una solución de software libre que supla las necesidades

requeridas, o cuando esté en riesgo de seguridad nacional, o cuando el proyecto

informático se encuentre en un punto de no retorno.

Art. 5: Tanto para software libre como software propietario, siempre y cuando se

satisfagan los requerimientos.

Art. 6: La subsecretaría de Informática como órgano regulador y ejecutor de las

políticas y proyectos informáticos en las entidades de Gobierno Central deberá

realizar el control y seguimiento de este Decreto.

Art. 7: Encargue de la ejecución de este decreto los señores Ministros

Coordinadores y el señor Secretario General de la Administración Pública y

Comunicación.

Ley Orgánica de Educación Superior

Art. 32.- Programas informáticos. - Las empresas que distribuyan programas

informáticos tienen la obligación de conceder tarifas preferenciales para el uso de

las licencias obligatorias de los respectivos programas, a favor de las instituciones

45

de educación superior, para fines académicos. Las instituciones de educación

superior obligatoriamente incorporarán el uso de programas informáticos con

software libre (Consejo de Educacion Superior, 2016).

Reglamento de régimen académico título 1 ámbito y objetivos

Artículo 1.- Ámbito. - El presente reglamento regula y orienta el quehacer

académico de las instituciones de educación superior (IES) en sus diversos

niveles de formación, incluyendo sus modalidades de aprendizaje o estudio y la

organización de los aprendizajes, en el marco de Jo dispuesto en la Ley Orgánica

de Educación Superior.

Artículo 2.- Objetivos. - Los objetivos del régimen académico son: (Sistema

Nacional de Nivelacion y Admision, 2016)

a. Garantizar una formación de alta calidad que propenda a la excelencia y

pertinencia del Sistema de Educación Superior, mediante su articulación a

las necesidades de la transformación y participación social, fundamentales

para alcanzar el Buen Vivir.

b. Regular la gestión académica-formativa en todos los niveles de formación

y modalidades de aprendizaje de la educación superior, con miras a

fortalecer la investigación, la formación académica y profesional, y la

vinculación con la sociedad.

c. Promover la diversidad, integralidad y flexibilidad de los itinerarios

académicos, entendiendo a éstos como la secuencia de niveles y

contenidos en el aprendizaje y la investigación.

d. Articular la formación académica y profesional, la investigación científica,

tecnológica y social, y la vinculación con la colectividad, en un marco de

calidad, innovación y pertinencia.

e. Favorecer la movilidad nacional e internacional de profesores,

investigadores, profesionales y estudiantes con miras a la integración de

la comunidad académica ecuatoriana en la dinámica del conocimiento a

nivel regional y mundial.

46

f. Contribuir a la formación del talento humano y al desarrollo de

profesionales y ciudadanos críticos, creativos, deliberativos y éticos, que

desarrollen conocimientos científicos, tecnológicos y humanísticos,

comprometiéndose con las transformaciones de los entornos sociales y

naturales, y respetando la interculturalidad, igualdad de género y demás

derechos constitucionales.

g. Desarrollar una educación centrada en los sujetos educativos,

promoviendo el desarrollo de contextos pedagógico-curriculares

interactivos, creativos y de construcción innovadora del conocimiento y los

saberes.

h. Impulsar el conocimiento de carácter multi, inter y trans disciplinario en la

formación de grado y postgrado, la investigación y la vinculación con la

colectividad.

i. Propiciar la integración de redes académicas y de investigación, tanto

nacional como internacional, para el desarrollo de procesos de producción

del conocimiento y los aprendizajes profesionales.

j. Desarrollar la educación superior bajo la perspectiva del bien público

social, aportando a la democratización del conocimiento para la garantía

de derechos y la reducción de inequidades.

LEY DE PROPIEDAD INTELECTUAL

Esta ley promulga los siguientes artículos para las personas creadoras de algún

sistema informático para ordenadores y cuyos fines es la venta o cualquier otro

propósito comercial. (OMPI, 2016)

Parágrafo primero de los programas de ordenador

Art. 28. Los programas de ordenador se consideran obras literarias y se protegen

como tales. Dicha protección se otorga independientemente de que hayan sido

incorporados en un ordenador y cualquiera sea la forma en que estén expresados,

47

ya sea en forma legible por el hombre (código fuente) o en forma legible por

máquina (código objeto), ya sean programas operativos y programas aplicativos,

incluyendo diagramas de flujo, planos, manuales de uso, y en general, aquellos

elementos que conformen la estructura, secuencia y organización del programa.

Art. 29. Es titular de un programa de ordenador, el productor, esto es la persona

natural o jurídica que toma la iniciativa y responsabilidad de la realización de la

obra. Se considerará titular, salvo prueba en contrario, a la persona cuyo nombre

conste en la obra o sus copias de la forma usual.

Dicho titular está además legitimado para ejercer en nombre propio los derechos

morales sobre la obra, incluyendo la facultad para decidir sobre su divulgación.

El productor tendrá el derecho exclusivo de realizar, autorizar o prohibir la

realización de modificaciones o versiones sucesivas del programa, y de

programas derivados del mismo.

Las disposiciones del presente artículo podrán ser modificadas mediante acuerdo

entre los autores y el productor.

Art. 30. La adquisición de un ejemplar de un programa de ordenador que haya

circulado lícitamente, autoriza a su propietario a realizar exclusivamente:

Una copia de la versión del programa legible por máquina (código objeto) con

fines de seguridad o resguardo;

Fijar el programa en la memoria interna del aparato, ya sea que dicha fijación

desaparezca o no al apagarlo, con el único fin y en la medida necesaria para

utilizar el programa;

Salvo prohibición expresa, adaptar el programa para su exclusivo uso

personal, siempre que se limite al uso normal previsto en la licencia. El

adquirente no podrá transferir a ningún título el soporte que contenga el

programa así adaptado, ni podrá utilizarlo de ninguna otra forma sin

autorización expresa, según las reglas generales.

48

Se requerirá de autorización del titular de los derechos para cualquier otra

utilización, inclusive la reproducción para fines de uso personal o el

aprovechamiento del programa por varias personas, a través de redes u otros

sistemas análogos, conocidos o por conocerse.

Convenios de cooperación firmados para el proyecto MONOIL

Dentro del Convenio de Colaboración e investigación entre el IRD, Ministerio del

Ambiente y PRAS para la realización conjunta de un estudio llamado MONOIL, se

detallan las siguientes clausulas en las cuales se especifican las obligaciones que

adquieren cada una de las partes involucradas; además de los compromisos de

confidencialidad que debemos respetar con respecto a la información que se nos

brindara para la realización del proyecto. (MONOIL, 2016)

Clausula Tercera. - OBJETO DEL CONVENIO

El presente convenio tiene como objetivo definir las modalidades de colaboración

entre el PRAS-MAE y el IRD, para la realización conjunta de un Estudio

denominado MONOIL, “Monitoreo ambiental, salud, sociedad y petróleo en

Ecuador”.

Clausula sexta. - OBLIGACIONES DE LAS PARTES

El PRAS del Ministerio del Medio Ambiente del Ecuador se compromete a:

Asignar a los investigadores e ingenieros de su equipo para una participación

global en el Estudio, equivalente al menos a la participación de un investigador a

tiempo completo:

Co-dirigir tesis de Máster o Doctorado, relacionados con el Estudio;

Facilitar las relaciones de colaboración con los otros organismos públicos o

privados en el Ecuador;

Proporcionar el apoyo del personal técnico, y, en la medida de sus

posibilidades, las facilidades administrativas y otros apoyos institucionales

49

para la correcta ejecución del Estudio en particular para obtener datos

existentes en las instituciones y administraciones del Estado Ecuatoriano.

Clausula Décima Primera. - CONFIDENCIALIDAD – PUBLICACIONES

Confidencialidad

11.1.2.- Además de los compromisos recíprocos de reserva asumidos por las

partes conforme a las estipulaciones expuestas, cada parte se compromete a no

publicar ni divulgar sin el acuerdo escrito de la otra parte, y eso, de cualquier forma

que sea, las informaciones científicas, técnicas o comerciales distintas a aquellas

resultantes del Estudio, en particular los conocimientos anteriores que

pertenezcan a la otra Parte y de los cuales ella podría llegar a conocer con motivo

de la ejecución del presente convenio y ello, siempre que dichas informaciones no

hubieren estado protegidas o no fueren de dominio público.

Toda derogación a esta obligación de confidencialidad deberá ser realizada en

común acuerdo y sometida a la aprobación de los responsables científicos de cada

Parte.

Las Partes sin embargo podrán comunicar a terceros tales informaciones para

satisfacer sus propias necesidades de investigación o para la evaluación de los

agentes o programas, con la condición de que estos terceros respeten las mismas

condiciones de confidencialidad.

Clausula Décimo Segunda. - PROPIEDAD DE LOS RESULTADOS:

Conocimientos no resultantes del Estudio

Los conocimientos obtenidos por las Partes con anterioridad al Estudio, quedan

bajo su propiedad respectiva.

Los conocimientos que tratan incluso sobre el objetivo del Estudio, pero que no

son resultado directo de los trabajos ejecutados en el marco del presente

convenio, pertenecen a la Parte que las ha obtenido. Para el efecto se sujetarán

a lo que disponen los artículos 322, 400 y 402 de la Constitución de la República

del Ecuador y la Ley de Propiedad Intelectual.

50

La otra parte no recibe sobre las patentes y el saber hacer correspondiente ningún

derecho por causa del presente convenio, son perjuicio de aplicar lo que dispone

el Art. 322, 400 y 402 de la Constitución de la República del Ecuador y la Ley de

Propiedad Intelectual.

HIPÓTESIS DE LA INVESTIGACIÓN DOCUMENTAL

Por medio de la investigación y desarrollo del presente documento se establece

una Base de Datos que sirve para el almacenamiento de la información de los

diferentes indicadores de pasivos ambientales y sociales de las actividades

económicas que han generado daño ambiental además de implementar

mecanismos, instrumentos y estrategias para la reparación integral de las

pérdidas del patrimonio natural y las condiciones de vida de la población afectada,

que han sido causadas por el actividades hidrocarburíferas.

Se responderán las siguientes inquietudes:

Si estandarizo y valido los modelos de entidad-relación, entonces se podrá

verificar y por ende brindará un óptimo modelado del diseño de la base de

datos.

Si logramos sistematizar y optimizar los scripts de consultas realizadas a la

base de datos por medio de los múltiples usuarios, entonces se tiene un

menor tiempo de respuesta y por ende un menor consumo de recursos.

Si analizo las estadísticas de las consultas base de datos, entonces podremos

identificar los procesos que afecten al rendimiento y encontrar soluciones

antes de las afectaciones.

Si se implementa el sistema de monitoreo del gestor de base de datos,

entonces aseguramos la identificación de los procesos del servidor que

afecten al rendimiento de los servicios del gestor de base de datos.

51

Variables de la Investigación

Variable independiente

Validación de los estándares y del modelado de entidad-relación de la base de

datos.

Variable dependiente I

Optimización y sistematización de los scripts de consultas a la base de datos.

Variable dependiente II

Implementación de una estructura entendible para cualquier usuario.

Variable dependiente III

Implementación de esquemas de las distintas estructuras usadas en el

modelamiento de la base de datos.

DEFINICIONES CONCEPTUALES

Se detallan los conceptos básicos que son utilizados en esta investigación

Base de datos. – Es aquel centro de información que alberga una variedad de

datos de cualquier índole sea estadísticos, científicos, matemáticos, educativos,

etc. pudiéndolos re categorizarlos de varias maneras posibles, esta información

puede está relacionada entre si permitiendo hacer su búsqueda de manera más

fácil y sencilla.

Bases de datos objeto-relacional.- Es una extensión de la base tradicional, con

la diferencia de que tiene las características brindadas por la programación

orientada a objetos.

https://es.wikipedia.org/wiki/Programaci%C3%B3n_orientada_a_objetos

https://es.wikipedia.org/wiki/Programaci%C3%B3n_orientada_a_objetos

52

DBMS Database Management System. – Aplicación cuyo principal fin es brindar

la asistencia al usuario de gestionar sobre la base de datos ejecutando consultas

y obteniendo estadísticas del consumo hacia el servidor.

METADATOS. - Recolector de datos que permiten identificar otros datos

mediante la clasificación, identificación, análisis sobre el gestor de la base de

datos.

SQL. - (Structured Query Language) es un lenguaje nativo de consultas

estructuradas con acceso a una base de datos relacional que identifica las

distintas operaciones que se puede realizar sobre ella, aplicando algoritmos

matemáticos reduce los costos de las operaciones realizadas sean de consultas

o de actualizaciones sobre los datos.

BSD. - Licencias usadas para los sistemas BSD (Berkeley Software Distribution),

son menos restrictivas que las licencias GPL por esto son frecuentemente usadas

por el dominio público, también permiten el uso de código fuentes sobre software

no libre, actualmente en sus nuevas versiones son denominadas licencias

modificadas BSD.

TSQL2.- Extensiones usadas para el manejo del paradigma de bases de datos

temporales, bitemporales, de transacciones.

CEPALSTAT. - Base de datos de la CEPAL es de uso público y puede ser

invocado mediante el uso de Servicios Web.

WHO. - Base de datos de la OMS es de uso público y puede ser invocado

mediante el uso de Servicios Web.

ITOPF. - Empresa dedicada a la contingencia en caso de derrames petroleros.

53

ADIOS2. – Sistema simulador de derrames petroleros.

RED7 PROCESS. – Esquematiza los indicadores usados por la CEPAL.

WTO – EDB. – Base de datos de la OMC dedicada al medio ambiente solo permite

consultar las estadísticas socioeconómicas y ambientales.

OIL & GAS. – Revista dedicada a los indicadores petroleros en todo el mundo,

con una especialidad en las refinerías ubicadas en el pacifico.

54

CAPÍTULO III

METODOLOGÍA DE LA INVESTIGACIÓN

DISEÑO DE LA INVESTIGACIÓN

Modalidad de la Investigación

Para el presente proyecto tomando en cuenta la necesidad por tener un gestor de

base de datos robusto que almacena la información de aquellas variables

presentes en la contaminación petrolera y de las variables presentes en las bases

de datos públicas de la CEPAL y OMS, determinamos que este proyecto es

factible tomando en cuenta la información tomada un 15% de campo, 15 análisis

experimental, 20% de bibliografías, y un 50% en base a los análisis aplicados para

los modelos Entidad/Relación, métodos de optimización y métodos de consultas

de estadísticas.

Se ha optado por utilizar un tipo de investigación aplicada para lo cual son

necesarios los conocimientos previos de una investigación básica, como resultado

nos permitirá resolver un problema existente dentro de un proyecto ya establecido.

“La investigación aplicada se centra en la búsqueda de una solución original de

un problema, que mejore las soluciones disponibles si es que las hay. Los centros

donde se cultiva son los de investigación aplicada y su calidad es evaluada por el

cliente para quien se desarrolló la solución del problema y por los pares de

investigador. El criterio que se sigue es la eficacia y eficiencia de la solución

desarrollada.” (Casalet, 1998)

55

TIPOS DE INVESTIGACIÓN

En el presente capítulo se explican los tipos de investigación que se usan para el

desarrollo del proyecto de tesis planteado. La correcta selección del tipo de

investigación está estrechamente relacionada con el objetivo general del proyecto,

además esto nos permitirá determinar, con exacta precisión, hacia donde va

dirigida nuestro proyecto y la manera de como analizaremos los datos obtenidos,

por lo tanto, la investigación que usaremos determinara el enfoque que le daremos

a nuestro proyecto.

Investigación Documental

Es el tipo de investigación que nos indica los documentos que se usan para la

obtención de los datos necesarios; el subtipo elegido de esta investigación es la

archivista, pues utilizaremos los documentos ya archivados de una investigación

básica anteriormente realizada.

“Este tipo de investigación es la que se realiza, como su nombre lo indica,

apoyándose en fuentes de carácter documental, esto es, en documentos de

cualquier especie. Las técnicas de investigación documental se sirven de datos

extraídos a partir del análisis, revisión e interpretación de documentos que aportan

información relevante para la comprensión del fenómeno.” (Zwerg-Villegas &

Ramírez Atehortúa, 2012).

Investigación explicativa

Como no existe algún proyecto parecido al que hemos tomado como tema de

tesis, este tipo de investigación es el más adecuado ya que nos permitirá

determinar los factores del problema y la solución al mismo.

“La investigación explicativa es apropiada cuando se necesita definir el problema

con más precisión, identificar las acciones a seguir, establecer las preguntas o

hipótesis de investigación, aislar y clasificar las variables fundamentales como

dependientes o independientes” (Malhotra, 2004).

56

PROYECTO FACTIBLE

Podemos denominar a un proyecto factible como aquel que se basa en una

investigación y análisis para poder satisfacer alguna necesidad de la población o

resolver un problema de la misma, claro está, que dicho proyecto debe estar

sustentado en una investigación que demuestre su veracidad.

Por todo lo expresado podemos concluir que el proyecto presentado es factible y

aplicable dentro del Proyecto de Investigación MONOIL tomando en cuenta que,

de la investigación realizada sobre las variables de contaminación ambiental

petrolera, Dayuma, de la CEPAL y OMS se las analiza con miembros

investigadores del proyecto de titulación para determinar cuáles son las que

necesita nuestra estructura principal de la base de datos.

MÉTODOS DE INVESTIGACIÓN

Existen muchos métodos de investigación, para este proyecto hemos analizado y

escogido los siguientes:

Método lógico deductivo

Este método se centra en el análisis de fundamentos desconocidos, en base a

aquellos centros de información conocidos; es decir analizaremos las bases de

datos libres y publicadas de las organizaciones (CEPAL, OMS) y de sistemas no

libres como (ITOPF, ADIOS2, RED7 PROCESS, OIL & GAS, BELA, WTO - EDB)

para crear una Base de datos sobre los problemas ambientales ocasionados por

el petróleo, posterior a eso unificar estas bases para ayuda de los investigadores

ambientales de MONOIL.

Método lógico inductivo

Se define como la investigación que parte de elementos simples hacia una base

de conocimientos más profunda, permitiendo tomar como referencia la formación

de hipótesis y demostración de las leyes.

57

Método de concordancia

Usamos este método para comparar varios Bases de datos y definir lo que se

repite en ellas, en base a este análisis tomamos las variables que definirán el

modelado de la base de datos final que es la propuesta para este proyecto.

Método de variaciones concomitantes

Este método indica si Los cambios que se producen sobre un determinado

elemento por alguna circunstancia y lo afectan de manera proporcional, puede

afectar la semántica de otro elemento con iguales características, es decir si en la

base de datos de la CEPAL y OMS tienen algún cambio significativo en una de

sus variables este puede afectar en nuestro modelado de base de datos.

Método histórico

Este método se basa en el estudio histórico de los elementos relacionados al

proyecto usando métodos, técnicas y un sin número de procesos relevantes, con

esta técnica podemos conocer la evolución y desarrollo del proyecto MONOIL.

Método analítico

Consiste en el estudio por separado de las partes de un todo, para poder

analizarlas para así determinar lo que tengan en común y poder usarlo como

beneficio nuestro permitiéndonos conocer detalladamente del objeto de estudio y

su comportamiento.

Método sistémico

Este método usado más en la hipótesis del proyecto contiene procesos en el cual

se combinan casos aislados en primera instancia, al finalizar su análisis se

formulan las teorías de sus elementos, está orientado a modelar el objeto, así

como la relación entre ellos, dicha relación nos indicara la estructura y dinámica

del objeto.

58

CONCEPTOS

Población

Se define población como el total de personas que presentan similitudes en ciertos

elementos, esta población es la que forma parte de una investigación o proyecto.

“Llamamos población o universo al conjunto de los elementos que van a ser

observados en la realización de un experimento. Cada uno de los elementos que

componen la población es llamado individuo o unidad estadística” (Vargas

Sabadías, Estadística descriptiva e inferencial, 1995)

Variable cuantitativa.

La variable cuantitativa es aquella que se expresa mediante variables numéricas,

es decir con ella se pueden resolver problemas aritméticos. (Moore, 2000)

Comenta: “Una variable cuantitativa toma valores numéricos, para los que tiene

sentido hacer operaciones aritméticas como sumas y medias.”

Variable cualitativa.

Este tipo de variables no se mide con números, si no es la que mide las cualidades

de los objetos que son parte de la investigación. Tal como indica (Kuby, 2008) :

“De atributos, o de categoría, clasifica o describe a un elemento de una población.”

Frecuencia Absoluta

Es el elemento que se puede llegar a repetirse varias veces en un análisis

estadístico. (Vargas Sabadías, Estadística Descriptiva e Inferencial, 1995) Indica

“Se llama frecuencia absoluta n, de la modalidad C (característica), al número de

individuos que presentan dicha modalidad.”

Frecuencia Relativa

La representación más significativa de esta frecuencia es tomando su valor

absoluto y dividirlo para la cantidad de elementos de la población denominada N.

Indica (Vargas Sabadías, Estadística Descriptiva e Inferencial, 1995) “Se llama

frecuencia relativa f, de la modalidad C, al cociente de dividir su frecuencia

absoluta n, por el número total de individuos de la población N.”

59

Representaciones gráficas

Para explicar de mejor manera datos que son resultado de una investigación, se

utilizan las representaciones gráficas; esto nos ayuda a entender de manera clara

todo lo que se investigó.

Una de las representaciones que se usaran en este proyecto es el Diagrama de

Barras en donde por medio de barras de colores se explican los resultados de una

investigación, pero para mayor entendimiento se explica la interpretación de

dichas barras. (Vargas Sabadías, Estadística Descriptiva e Inferencial, 1995) Nos

dice: “Un despliegue gráfico proporciona una impresión de ayuda a clasificar la

variabilidad y simetría de la distribución que figura en la tabla de frecuencias.”

Distribución de Frecuencias

Es la representación y ordenamiento mediante graficas estadísticas a cierta

distribución de una frecuencia. (Vargas Sabadías, Estadística Descriptiva e

Inferencial, 1995) Comenta: “Es la clasificación de los datos de acuerdo a la

modalidad del carácter que pertenece cada uno de los individuos y se ordenan,

anotando sus resultados en una tabla.”

Media

Podemos definir como media a la suma de la información de muestra dividida para

la cantidad total, también se la llama promedio. (Gordas, Cardiel, & Zamorano,

2011) “La media se calcula sencillamente sumando los distintos valores de x y

dividiendo por el número de datos.”

Mediana

La mediana es el valor que está ubicado en la parte central de toda la población a

la cual realizaremos la investigación. (Vladimirovna Panteleeva, 2002) “La

mediana de un conjunto de datos es el valor medio de los datos cuando estos se

han ordenados en forma no decreciente en cuanto a su magnitud”

60

Histograma

Es la parte gráfica de las variables a usar en la investigación. (Triola, 2004) “Es un

gráfico de barras en donde la escala horizontal representa clases de valores de

datos y la escala vertical representa frecuencias”.

POBLACIÓN Y MUESTRA

Población

Una vez se tengan los objetivos principales a cumplir y tener las variables de

nuestro proyecto, se determina mediante estudios la población relacionada o la

más cercana a la problemática para tomarlos como referencia en nuestra

investigación.

Dentro de nuestro proyecto se considera como población a 5 docentes; de los

cuales 3 son miembros del equipo de líderes del proyecto MONOIL 60% y 2 como

miembros lo cual representa el 40% de la población.

En esta investigación documental se usan como unidades de análisis los

siguientes:

Observación documental

Base de datos en línea (Petroleras).

Software Administradores de Bases Petroleras.

Bases de datos Públicas de la CEPAL y OMS.

Enciclopedias y libros.

Publicaciones periódicas, como revistas académicas y científicas.

Recopilación de datos por parte de investigadores del proyecto.

61

Matriz de Operacionalización de Variables

Cuadro #5: Matriz de Operacionalización de Variables Dependientes e Independientes del proyecto.

Variable Dimensiones Indicadores Técnicas y/o Instrumentos

V.I. Validación de estándares y del modelado entidad-relación de BD.

Validación del modelado E/R

Comprensión del modelado de E/R por parte de los investigadores del proyecto.

Pregunta #1, 3 de la entrevista.

V.D.1 Optimización de los scripts de consultas a la base de datos

Optimizar SQL de acceso a gestor de base de datos de MONOIL.

Optimización en scripts de consulta, eliminación, actualización

Pregunta #2 de la entrevista.

V.D.2 Implementación de una estructura entendible para cualquier usuario

Estructura normalizada.

Normalización de la base de datos diseñada. Aplicar estándares actuales.


V.D.3 Implementación de esquemas de las distintas estructuras usadas en el modelamiento de la base de datos.

Creación de varias estructuras sin perder rendimiento.

Revisión de esquemas. Rendimiento de los esquemas aplicados en la base de datos.




Instrumentos de recolección de datos

Definimos las técnicas y procedimientos que se usan en la recolección de la

información necesaria para un determinado proyecto. Otro concepto que podemos

indicar es, “La técnica de recolección de información alude a los procedimientos

62

mediante los cuales se generan informaciones válidas y confiables, para ser

utilizados como datos científicos.” (Yuni & Urbano, 2006)

Para la recolección de datos se usa un sinnúmero de instrumentos los cuales se

definen como la cantidad de recursos a usar por el investigador para la extracción

de datos necesarios para el proyecto que se tenga planteado.

Técnica

Las técnicas usadas para recopilar información necesaria en la realización de un

proyecto son:

Entrevistas

Observación

Entrevista

Podemos definir como entrevista a una conversación personal entre el

investigador y uno o más interesados en el proyecto, estas preguntas deben ser

concretas o similares a las utilizadas en una encuesta.

Observaciones

Las observaciones no requieren participación directa de los interesados en el

proyecto. El investigador obtiene los datos analizando las conductas diarias de los

participantes del proyecto, las observaciones pueden ser:

Observación directa. - Es cuando el investigador estudia directamente a los

involucrados en el estudio, se contacta directamente con el hecho a

investigar.

63

Observación indirecta. - Es el tipo de observación donde el investigador

utiliza herramientas realizadas por otra persona para lograr un mejor enfoque

del tema a investigar.

Observación Documental. - Se refiere al tipo de observación fundamentado

en libros, informes, biografías, revistas, etc. Las fichas bibliográficas es la

técnica más usada para este tipo de investigación, ya que sirve para citar y

tener presente la fuente utilizada en la investigación.

Observación estructurada. - En este tipo de observación el investigador

sabe de antemano lo que va a registrar y como lo realizará.

Por las definiciones dadas anteriormente para la recopilación de información en el

presente proyecto de tesis se consideró como más adecuada la observación

documental, ya que se necesita recopilar la información de varias fuentes y así

armar un solo repositorio que es de mucha ayuda para los interesados del

proyecto.

Entre los instrumentos usados en la recolección de la información, podemos

detallar las siguientes:

Bibliográficos

Repositorio de organizaciones como (CEPAL, OMS, petroleras) para así

unificar y armar una Base de datos necesaria para los investigadores del

proyecto MONOIL.

Los datos recolectados fueron analizados y ordenados a través de fichas y

hojas de cálculo y así lograr estudiar de forma detallada lo realmente

necesario para la investigación.

Con el uso de entrevistas se recolecto una gran cantidad de información referente

a la aceptación del proyecto ante los investigadores del proyecto MONOIL. Las

preguntas utilizadas en dicha entrevista fueron redactadas de tal manera que los

64

interesados en el proyecto puedan entender los términos que se usaron para

poder lograr una recopilación de información relevante

Recolección de la Información

La recopilación de la información tomada se basa en el análisis desarrollado hacia

las bases de datos de organizaciones como CEPAL, OMS y varias bases

petroleras.

Otra forma de recopilación de información fue también por medio de información

bibliográfica y artículos en revistas de educación ambiental.

Para la elaboración de la entrevista re hizo un análisis de las preguntas a

considerar tomando en cuenta el grupo hacia el cual iban dirigidas posterior a eso

se realizó el análisis y procesos de la información recolectada.

Procesamiento y Análisis

Para poder analizar la información se utiliza una encuesta documentada, esta

encuesta se desarrolla con un total de 6 preguntas. El siguiente paso, luego del

tiempo establecido para la resolución de la encuesta, fue el procesamiento de la

información el cual está representado en los cuadros y gráficos que se detallan a

continuación.

65

DESCRIPCIÓN DE VARIABLES

Tablas de Variables Cualitativas

Estas variables son las utilizadas en las entrevistas, permiten determinar su peso

para la realización de los diagramas de barras y el análisis.

Cuadro #6: Variables Cualitativas I usado en entrevistas

DESCRIPCION VALOR

Totalmente de acuerdo 5

Parcialmente de acuerdo 4

Indiferente 3

Parcialmente en desacuerdo 2

Totalmente en desacuerdo 1



Cuadro #7: Variables Cualitativas II usado en entrevistas

DESCRIPCION VALOR

Excelente trabajo 5

Buen trabajo 4

Faltan pocos detalles 3

Trabajo inconcluso 2

Pésimo trabajo 1



Cuadro #8: Variables Cualitativas III usado en entrevistas

DESCRIPCION VALOR

Completamente entendible 5

Fácil entendimiento 4

Se entiende a medias 3

Difícil entendimiento 2

No se entiende nada 1



66

Tablas de Variables de frecuencia Cuantitativas

Variable Edad

Para determinar la edad promedio de los entrevistados y determinar un nivel de

experiencia por parte de ellos.

Cuadro #9: Frecuencia variable Edad

Rango Edad Frecuencia Absoluta

Frecuencia Relativa

18-26 7 70%

26-36 3 30%

36-46 0 0%

Total 10 100% Fuente: Pedro Villafuerte Yagual


67

PREGUNTAS REALIZADAS EN LA ENTREVISTA

Personal involucrado en la entrevista: Investigadores y desarrolladores

Pregunta1 ¿Cree usted que el método utilizado para la recopilación de

información para crear la base de datos ambiental y la base de datos de la CEPAL

y OMS es el correcto?

Cuadro #10: Información Documentada en proyecto – pregunta 1

Información Documentada Frecuencia Absoluta

Frecuencia Relativa

Totalmente de acuerdo 4 40%

Parcialmente de acuerdo 5 50%

Indiferente 1 10%

Parcialmente en desacuerdo 0 0%

Totalmente en desacuerdo 0 0%

Total 10 100%



Gráfico # 5: Representación de Pregunta 1


Elaboración: Pedro Villafuerte Yagual

Análisis e interpretación:

Del porcentaje total de la población un 50% está parcialmente de acuerdo con el

método utilizado para la recopilación de información, por otro lado, un 40% no está

de acuerdo, mientras que un 10% le es indiferente la forma en la que se recopila

información.

0,00%20,00%40,00%60,00%

Información Documentada

68

Pregunta 2. De lo analizado en la base de datos, ¿Cómo usted considera el

trabajo investigado para le realización de la unificación de las Base de datos

ambientales petroleras, CEPAL, OMS, y el tiempo de respuesta al ser consumidos

por otros sistemas?

Cuadro #11: Trabajo realizado en unificación de base de datos – pregunta 2

Trabajo realizado Frecuencia Absoluta

Frecuencia Relativa

Excelente trabajo 5 50%

Buen trabajo 4 40%

Faltan pocos detalles 1 10%

Trabajo inconcluso 0 00%

Pésimo trabajo 0 0%

Total 10 100%







Del total de la población entrevistada el 50% considera que es excelente la forma

en la que se ha investigado la información para el proyecto de tesis, un 40% de la

población considera que es un buen trabajo y un 10% indica que le faltan algunos

detalles.

0%

20%

40%

60%

Excelentetrabajo

Buentrabajo

Faltanpocos

detalles

Trabajoinconcluso

Pésimotrabajo

Trabajo investigativo

69

Pregunta3. ¿Cómo usted considera el entendimiento del modelo de E/R aplicado

a la base de datos MONOIL para el uso de los investigadores?

Cuadro #12: Entendimiento modelo E/R – pregunta 3

Entendimiento modelo E/R

Frecuencia Absoluta

Frecuencia Relativa

Completamente entendible

4 40%

Fácil entendimiento 5 50%

Se entiende a medias 1 10%

Difícil entendimiento 0 00%

No se entiende nada 0 00%

Total 10 100%







Del total de la población entrevistada el 50% indica que le es de fácil entendimiento

el modelo E/R aplicado a la base, un porcentaje casi igual 40% nos dice que es

completamente entendible este modelo, mientras que un 10% lo entiende a

medias.

0%10%20%30%40%50%

Pregunta 3

70

Pregunta4. ¿Considera Usted que es entendible la estructura presentada sobre

la base de datos MONOIL o es necesario de un manual de usuario para tener un

entendimiento más claro y concisa?

Cuadro #13: Entendimiento estructura MONOIL – pregunta 4

Estructura MONOIL Frecuencia Absoluta

Frecuencia Relativa


4 40%

Fácil entendimiento 4 40%

Se entiende a medias 2 20%

Difícil entendimiento 0 00%

No se entiende nada 0 00%

Total 10 100% Fuente: Pedro Villafuerte Yagual






Un total de 40% de la población considera que es completamente entendible la

estructura sobre la base de datos MONOIL, un igual porcentaje indica que es de

fácil entendimiento, mientras que un 20% lo entiende a medias.

0%

10%

20%

30%

40%

Uso de Estadisticas

71

Pregunta5. ¿Considera usted que separar la base de datos en varias estructuras

llamadas esquemas permite tener un mayor rendimiento al momento de realizar

consultas?

Cuadro #14: Uso de esquemas en base de datos – pregunta 5

Monitoreo Base de Datos

Frecuencia Absoluta

Frecuencia

Relativa

Totalmente de acuerdo 6 60%

Parcialmente de acuerdo

2 20%

Indiferente 2 20%

Parcialmente en desacuerdo

0 00%

Totalmente en desacuerdo

0 00%

Total 10 100%







Del total de la población una mayor parte que se representa como en 60%

considera que la utilización de varios esquemas en el modelamiento de la base de

datos es de utilidad. Con un mismo porcentaje 20% están parcialmente de acuerdo

y le es indiferente el tema.

0%

20%

40%

60%

Monitoreo de Base de Datos ProtgreSQL

72

Validación de la Hipótesis

Luego de realizada el levantamiento de la información por medio de los métodos

que ya se explicaron anteriormente, se puede dar como resultado que es

necesaria la implementación de una base de datos que logre reunir la información

de varios repositorios, esto como ya hemos analizado le es de mucha ayuda para

los investigadores del proyecto MONOIL ya que les ahorrará tiempo, y costos

además de brindarles de forma rápida la información necesaria en sus actividades,

también se puede definir que esta Base de Datos resguardara de manera segura

toda la información confidencial que se enmarque dentro del proyecto en mención.

73

CAPÍTULO IV

PROPUESTA TECNOLÓGICA

Luego de haber investigado y analizado la problemática; se define la siguiente

propuesta tecnológica como solución al tema general objeto de este estudio.

Como propuesta general es la creación de una base de datos unificada en el

gestor PostgreSQL; la cual tomara información de repositorios que corresponden

a instituciones como CEPAL, OMS y datos correspondientes a la contaminación

ambiental producida por el petróleo.

Dichas instituciones cuentan con información muy amplia la cual es necesaria para

los investigadores, pero a la vez es tan extensa que se dificulta el estudio. Es por

este motivo que se presentó este proyecto de tesis, para así crear una base de

datos con información específica y netamente necesaria para los investigadores

las cuales les puede ahorrar tiempo y costos.

FACTIBILIDAD

Se toma en cuenta los siguientes puntos, los cuales son estudiados y analizados:

Control en redundancia

Factibilidad operacional

Factibilidad técnica

Factibilidad legal

Factibilidad económica

Análisis de Factibilidad

Después de haber analizado con los diferentes métodos de investigación la

problemática del estudio, se determina que la ejecución del tema de tesis

propuesto es factible para el éxito del proyecto.

Con el correcto análisis de la factibilidad se puede comprobar si el proyecto de

tesis planteado es viable para la realización. De no cumplir con los aspectos

fundamentales que comprueben su viabilidad entonces el proyecto se definiría

74

como abandonado o también se podría postergar, esto dependiendo del resultado

del análisis.

Grafico # 10: Análisis de factibilidad de un problema

Fuente: Pedro Villafuerte Yagual Elaboración: Pedro Villafuerte Yagual

Con el análisis de la encuesta realizada a la población se pudo detectar la

necesidad de este software y el impacto que este tendrá sobre la población

estudiada.

Factibilidad Operacional

El principal objetivo de la factibilidad operacional es lograr que el nuevo software

no sea complejo para los usuarios siendo un proyecto de fácil entendimiento y

75

amigable, para este procedimiento es necesario que se conozca del

funcionamiento del mismo y que se realicen constantes evaluaciones sobre los

integrantes del proyecto prevaleciendo el objetivo principal de tener un máximo

rendimiento.

El personal que usara la base de datos se encuentra totalmente interesados en la

realización del mismo ya que todos coinciden con la pronta necesidad del sistema.

Además de no estar de acuerdo con la forma en la que actualmente se recopila la

información y no tener un repositorio de los datos.

Es por este motivo que para el desarrollo del proyecto se analiza y considera todas

y cada una de las propuestas de los usuarios, las mismas que reflejaban sus

necesidades actuales, nuestro principal objetivo es dar solución a estas

necesidades y entregar un modelado de base de datos escalable.

Factibilidad Técnica

Para la tesis propuesta se evalúa la herramienta tecnológica que poseen los

interesados para poder comprobar la compatibilidad de los sistemas operativos.

Las necesidades de los equipos deben ser las siguientes:

Hardware

Servidor con sistema operativo Linux.

RAM de 8 GB

Disco Duro 500 GB

Software

Apache Tomcat.

Servidor de Base de datos PostgreSQL

IDE para PostgreSQL PGADMIN.

76

Nivel Técnico

Conocimientos técnicos en Modelamiento de Base de datos.

Conocimientos en Base de Datos

Conocimiento en Afinación de Scripts de consultas.

Grafico # 11: Esquema Conexión Cliente/Servidor

Fuente: Pedro Villafuerte Yagual Elaboración: Pedro Villafuerte Yagual

Factibilidad Legal

La factibilidad legal identifica si los requisitos del proyecto violan o atentan contra

alguna ley que sea acorde al proyecto.

Tal como se explica en el Capítulo II, donde se detalla los principios legales que

se tomaron en cuenta para la elaboración del presente proyecto de tesis; por lo

expuesto en ese punto podemos concluir que el tema propuesto es viable para la

ejecución ya que no infringe en ninguno de los artículos mencionados en el texto

anterior.

Entre los artículos que se tomaron en cuenta están los siguientes:

Decreto 1014

Establece reglas sobre el uso del software libre en servidores como ambientes de

producción o desarrollo.

Afinamiento de scripts Modelamiento BD

77

Ley Orgánica de Educación Superior.

Establece las normas para los costos de los programas informáticos o de sus

licencias en caso de que sea un sistema comercial.

Las instituciones de educación superior deben tener programas basados en

software libre.

Ley de la propiedad Intelectual.

Esta ley se aplica sobre los sistemas creados, ya sea un programa, manual,

diagrama de flujo, estructuras.

Factibilidad Económica

Mediante este estudio determinamos el costo/beneficio que se puede tener en el

modelado de datos, se analiza el recurso costo técnico y humano.

Para el estudio de la factibilidad económica se detallan los siguientes cuadros

donde se reflejan los costos del proyecto:

Cuadro #15: Comparativo de ingresos y egresos en el proyecto.

INGRESOS EGRESOS

Total, comparativo de ingresos y egresos 0,00 1820,00

Fuente: Datos de la investigación


Egresos del proyecto

Los egresos o gastos del proyecto se pueden puntualizar en el siguiente cuadro

el cual también se ha representado con un gráfico circular, para un mejor

entendimiento.

78

Cuadro #16: Concepto de egresos en el proyecto

CONCEPTO DE EGRESOS DÓLARES

Libros y documentos guías 30,00

Internet 80,00

Fotocopias 45,00

Suministros de oficina 85,00

Computadoras 900,00

Transporte 100,00

Comida 150,00

Impresiones de encuestas 25,00

Impresión de tesis y borrador 125,00

Anillado y empastado de tesis 60,00

Consumo Eléctrico 120,00

Varios 100,00

TOTAL 1820,00



Grafico # 12: Egresos del Proyecto



2% 4%2%

5%

49%6%

8%

1%

7%

3%7%

6%

Libros y documentos guías

Internet

Fotocopias

Suministros de oficina

Computadoras

Transporte

Comida

Impresiones de encuestas

Impresión de tesis y borrador

Anillado y empastado de tesis

Consumo Eléctrico

79

Beneficios del proyecto

Los beneficios del proyecto los podemos dividir en dos grupos

Beneficios materiales

Base de datos con información oportuna y actualizada

Beneficios inmateriales

Conocimiento aprendido

Agilidad en las labores diarias de los interesados del proyecto

Análisis Costo-Beneficio

Un análisis costo-beneficio nos sirve para medir la rentabilidad financiera de un

proyecto; es decir con este resultado podemos concluir si la realización del

proyecto es viable o no.

La fórmula general para el cálculo es:

Donde el significado de las siglas es:

B/C: Relación Costo-Beneficio

VAI: Valor Actual de los Ingresos

VAC: Valor Actual de los Costos

El resultado de este análisis nos indicara lo siguiente:

Si B/C >1: Los beneficios superan los costos por lo tanto el proyecto es viable.

Si B/C <1: Los costos son mayores que los beneficios, el proyecto no se

considera.

Si B/C =1: Los beneficios son iguales a los costos, no hay ganancias con este

proyecto.

El presupuesto actual que maneja MONOIL por cada investigación asignada a una

persona es de aproximadamente $8750, desglosado de la siguiente manera:

80

Cuadro #17: Presupuesto estimado actual MONOIL

Descripción Costo 3 meses

Consumo Internet $150

Alimentos $500

Libros y Documentos guías $250

Transporte $1000

Impresiones $150

Varios $700

Sueldo $6000

Total, VAI $8750



Al utilizar como repositorio el gestor de base de datos y al realizar las consultas

directamente sobre la base el costo es menor:

Cuadro #18: Costo estimado actual MONOIL

Descripción Costo 3 meses

Consumo Internet $100

Alimentos $400

Libros y Documentos guías $150

Transporte $700

Impresiones $100

Varios $500

Sueldo $6000

Total, VAC $7950



B/C = VAI/VAC

B/C = 8750/7950

B/C = 1,10

Cumpliendo la condición:

Si B/C >1: Los beneficios superan los costos por lo tanto el proyecto es viable.

81

Etapas de la metodología del proyecto

Mejora Continua

Actualmente la forma de recopilación de información por parte de los

investigadores de MONOIL se evidencia una gran vulnerabilidad ya que no existe

un control adecuado en el proceso de la información sobre los contaminantes

petroleros en la región Amazónica del Ecuador. A la vez no cuentan con un

repositorio general para la búsqueda de información relacionada a problemas de

salud o de medidas poblacionales.

En la realización del proyecto se buscó las desventajas del proceso actual de

levantamiento de información para lo cual utilizamos el análisis FODA para

verificar la situación actual.

El análisis FODA consiste en realizar una evaluación de los factores fuertes

y débiles que, en su conjunto, diagnostican la situación interna de una

organización, así como su evaluación externa, es decir, las oportunidades y

amenazas. También es una herramienta que puede considerarse sencilla y que

permite obtener una perspectiva general de la situación estratégica de una

organización determinada. (Ponce Talancón, 2007)

82

Cuadro #19: Análisis FODA

Fortalezas Oportunidades

Acceso permitido solo hacia

los usuarios investigadores.

Cantidad de Información

recolectada sobre los

problemas ambientales.

Normalización sobre la

información.

Elaboración de una estrategia de

pruebas que analicen el

rendimiento de la información.

Recolección de información

capaz de aplicarse mejoras.

Análisis de estadísticas sobre la

información.

Debilidades Amenazas

No existe un control de acceso por

cada investigador.

No existe información relacionada

a la contaminación ambiental

petrolera.

No existe un sistema de

autogestión.

Robo o pérdida de información.

Mal uso de la disponibilidad de la

información.



FORTALEZAS

La fortaleza principal del manejo de la información actual por parte de los

investigadores de MONOIL sobre la contaminación ambiental es el acceso

restringido hacia los usuarios investigadores ya que cada uno de ellos procesa la

información asignada, las cuales contempla varios temas incluyendo el análisis de

contaminación petrolera, salud, socio económico las cuales cumplen los

estándares de normalización propuesta por ellos para una mejor identificación de

los datos.

83

OPORTUNIDADES

Dentro de las oportunidades podemos constatar la elaboración de una estrategia

para identificar el actual rendimiento de la información procesada, analizando los

tiempos de respuesta para determinadas investigaciones sobre la contaminación

ambiental y poder compararlas con la información automatizada que tendrá la

base de datos de MONOIL, se podrá constatar las mejoras que se puedan aplicar

a la recolección de esta información, el análisis de las estadísticas en base a la

información recolectada también es una oportunidad ya que al aplicarse la mejora

con la base de datos se identificara esta información requerida sin necesidad de

una investigación exhaustiva.

DEBILIDADES

Actualmente se evidencia que no existe un control de acceso hacia cada

investigador, es decir, todos pueden acceder a la misma información a pesar del

nivel de conocimiento que presenten sobre dicha investigación. La data

recolectada por parte de sus investigadores sobre la contaminación ambiental es

en un plano general y no presentan un repositorio que respalde la información de

la contaminación petrolera en el amazonas ni las bases de datos de la CEPAL y

OMS. La actualización constante sobre estos datos se lo realiza de forma manual,

es decir no hay una auto gestión.

AMENAZAS

En base a las debilidades expuestas logramos evidenciar que la pérdida o robo

de información es uno de los procesos más críticos en la actualidad sobre la

búsqueda de la información de la contaminación ambiental, al no existir un

repositorio de datos con acceso restringido cualquier usuario puede hacer uso de

estos datos, esto también deja en evidencia el mal uso sobre la disponibilidad de

los datos recolectados.

84

Grafico # 13: Diagrama de Causa – Efecto

Investigadores

Diferentes fuentes de acceso. - Actualmente para la obtención de la información

los investigadores recurren a diversos medios de recopilación de información más

aun cuando la búsqueda es sobre los contaminantes ambientales, para esto con

la implementación de la base de datos tendrán un sistema en donde podrán buscar

la información relevante para ellos.

No existe repositorio de Información. – Al no existir un lugar donde se almacena

la data a buscar deben cumplir tareas más exhaustivas que alargan el tiempo

destinado a cierta investigación, con un repositorio la información es más concreta

y rápida.

Elaboración: Pedro Villafuerte Y. Fuente: Pedro Villafuerte Y.

85

Base de Datos

Falta coordinación de la información. – No existe un control para la

coordinación de la información recolectada, los datos de la contaminación

ambiental petrolera pueden ser usada por varios investigadores, pero ellos

trataran la información acorde a sus necesidades.

Desconfianza en resguardo de información. – La desconfianza al guardar su

información en archivos propios se da por la falta de seguridad que esta puede

brindar, para esto el repositorio de la base de datos debe brindar la seguridad en

el resguardo de los registros que se vaya a almacenar.

Estándares

No se utilizan estándares de almacenamiento. - Al ser tratada por diferentes

medios no siempre se llega a un determinado fin, las investigaciones deben

cumplir con ciertas normas para fácil entendimiento por parte de los usuarios, al

estar en un repositorio de datos los investigadores deben cumplir las normas que

se aplican en esta sea cual sea la forma de procesar su información.

Falta de Control de Calidad. – El proceso manual de los datos puede ocasionar

una falta de estándares sobre los controles de calidad de las investigaciones, una

correcta estructura sobre la base de datos permite mejorar este proceso y se tiene

un determinado lineamiento sobre la información sea cual sea su medio.

Fuentes

Falta de datos sobre contaminación. – Actualmente no se encuentra con la

información correcta sobre la contaminación ambiental ocasionada por el petróleo

en la amazonia ecuatoriana, en base a las investigaciones realizadas se brinda de

esta base de datos que tomará como estructura las bases de datos de

contaminación petrolera mundial convirtiéndola en una base de datos

multiplataforma.

86

Falta de permisos a múltiples fuentes. – Para acceder a diversos sistemas

externos para consultar información, se necesita de diversos permisos y una serie

de medios para extraer la data y un lugar donde se almacene digitalmente, esta

falta de recursos limita los tiempos del planeamiento y análisis que necesitan los

investigadores.

PROCESO DE MEJORA

MAPA DE PROCESO

A continuación, se muestran los mapas de procesos a utilizar en la elaboración

del modelo E/R a utilizar en el proyecto de contaminación ambiental petrolera y la

unificación con las bases de datos de la CEPAL y OMS.

87

CREAR ESTANDAR DE BASE DE DATOS

Se crea un estándar sobre el desarrollo a la base de datos para que sea utilizado

por todos los integrantes del proyecto MONOIL, de esta manera se tendrá un

entendimiento más claro sobre la información que se resguardara sobre la base.

Grafico # 14: Análisis Estándar BD


88

ANÁLISIS DE ESQUEMAS CEPAL

Mediante análisis se determinó la estructura de la base de datos de la CEPAL

(CEPALSTAT) el cual está separado en un esquema diferente para no alterar los

datos de contaminación ambiental petrolera y Dayuma, esta base de datos

mediante los WS desarrollados por otros miembros del proyecto MONOIL es

capaz de auto alimentarse y a la vez brindar reportes de datos en tiempo real.

Grafico # 15: Análisis Esquema CEPAL


89

ANÁLISIS DE BD DE OMS

Mediante análisis se determina la estructura de la base de datos de la OMS (GHO

Database). La cual está separada en un esquema diferente para no alterar los

datos de contaminación ambiental petrolera y Dayuma. La base de datos mediante

los WS desarrollados por otros miembros del proyecto MONOIL es capaz de auto

alimentarse y a la vez brindar reportes y estadísticas de datos en tiempo real.

Grafico # 16: Análisis Esquema OMS


90

ANÁLISIS DE BD CONTAMINACIÓN PETROLERA Y DAYUMA

Mediante análisis se determinó la estructura de la base de datos contaminación

ambiental petrolera y Dayuma. Las variables son analizadas con los grupos de

investigación del proyecto MONOIL para obtener la estructura más idónea, Se

utilizada posteriormente para la creación de los reportes que mostraran las

estadísticas utilizadas por los investigadores de MONOIL.

Grafico # 17: Análisis Esquema Contaminación


91

UNIFICACIÓN DE ESQUEMAS

Se analizaron los esquemas construidos para determinar las tablas que generales

que son utilizadas en todos los módulos y construir un esquema que contengan

esas estructuras. La integridad de los datos se mantiene y no hay afectación

alguna en cada llamada por parte de agentes externos.

Grafico # 18: Análisis Unificación de Esquemas


92

Metodología de trabajo

En esta parte del documento describimos la implementación de la metodología

SCRUM que fue la utilizada para la creación de la base de datos de la

contaminación ambiental petrolera para el proyecto binacional MONOIL.

A continuación, se describirán los ciclos de vida que se usa en el proyecto, así

como los pasos para la gestión de las tareas sus requisitos, avances y

responsabilidades técnicas.

Propósito de la documentación

Facilita la información necesaria hacia los miembros implicados en esta parte del

proyecto MONOIL.

Alcance

Todos los procedimientos y miembros descritos en el desarrollo del proyecto

MONOIL.

Descripción General de la Metodología

Fundamentación

Entre las principales razones usadas en el ciclo de desarrollo usando la

Metodología SCRUM podemos definir las siguientes:

Las características que tiene la base de datos de contaminación ambiental del

proyecto MONOIL tiene un incremente en sus funcionalidades ya que se

deberá acoplar a cualquier otro sistema.

Frecuentemente se debe entregar al cliente los avances por cada módulo

terminado, para que exista un corto periodo de tiempo donde se aplique una

mejora continua, todos estos avances deben ser claros y bien detallados.

Posibles cambios entre los requisitos principales.

93

Estructura debe ser implementada orientándose a la necesidad de que el

sistema pueda implementar más funcionalidades que no fueron identificadas

anteriormente.

Durante la ejecución del proyecto frecuentemente se dan cambios que

modifican el orden de los requisitos iniciales, es decir puede existir un cambio

en las historias de usuarios.

Es difícil entender desde el inicio del proyecto la dimensión real que tiene el

sistema para lo cual las implementaciones de las historias de usuarios deben

ser en el tiempo indicado para evitar afectaciones futuras.

Valores de trabajo

Para que esta metodología tenga éxito se deben cumplir los siguientes valores

hacia los participantes del proyecto:

Dedicarse al proyecto

Respeto hacia los integrantes del proyecto

Responsabilidad, eficacia, disciplina

Atención netamente sobre la tarea.

Transparencia y efectividad sobre el proyecto.

Etapas de la metodología SCRUM usadas en el proyecto

A continuación, se describen las etapas usadas en la implementación del proyecto

en base a esta metodología.

1. Identificación de los requerimientos solicitados.

2. Análisis del proyecto por etapas.

3. Diseño y Ejecución.

4. Pruebas finales.

94

Identificación de Requerimientos solicitados

En base a reuniones iniciales con las personas involucradas netamente en el

proyecto se determinó la necesidad de una base de datos capaz de abarcar toda

la información referente a la contaminación petrolera en la amazonia ecuatoriana

especialmente en el aire, agua, tierra, especies vivas, Dayuma y que también

pueda abarcar información de los indicadores de salud y contaminación provistos

por la CEPAL y OMS.

Para cumplir con este requerimiento se debe analizar las afectaciones del petróleo

en cada uno de los componentes descritos anteriormente para saber que lo

provoco y cual fue o puede ser el método de remediación a implementar, para el

caso de las bases de datos de la CEPAL y OMS se debe analizar las estructuras

que estas proveen en sus estructuras a través de los servicios Web que estos

proveen.

REQUERIMIENTOS FUNCIONALES

R.F.1: Uso de un estándar aplicado a la base de datos PostgreSQL por todos los

miembros desarrolladores del proyecto MONOIL, para facilitar el uso y posterior

unificación de los esquemas creados.

R.F.2: Consultar en un esquema individual toda la estructura e información

referente a la contaminación ambiental petrolera en el aire, agua, tierra, especies

vivas y parroquia Dayuma para ser utilizados posteriormente por los

investigadores del proyecto MONOIL y para generación de reportes.

R.F.3: Consultar en un esquema individual toda la estructura e información

referente a los esquemas de base de datos de la CEPAL y OMS para la posterior

generación de reportes estadísticos.

95

REQUERIMIENTOS NO FUNCIONALES

R.N.F.1: Las estructuras creadas deben ser capaz de no afectar la información de

cada esquema creado.

R.N.F.2: El esquema de la CEPAL y OMS debe soportar la mayor

transaccionalidad posible por la cantidad de datos que puede albergar, esto sin

afectar el rendimiento de los demás esquemas.

R.N.F.3: Verificar la factibilidad de un sistema de monitoreo para verificar el

rendimiento del uso de base de datos PostgreSQL.

Estos requerimientos deben ser analizados con los involucrados en el proyecto

para revalidarlos y aplicar las respectivas mejoras en caso de ser necesario.

Análisis del proyecto por etapas.

Luego de haber obtenido los requerimientos de usuarios se realizó la creación de

las historias de usuarios por cada esquema creado y los análisis tomados de las

bases de datos libres, la OMS y la CEPAL.

Para el ambiente de desarrollo se utiliza una computadora HP con procesador i7,

8Gb de RAM, utilizando como gestor de base de datos se usó PostgreSQL y como

clientes pgAdmin III, Navicat.

Backlog de Producto

Roles

Administrador de Usuarios

Arquitectura de BD

Gestión de Esquemas

Lista de historias de usuario

1. Estándar de la base de datos.

2. Creación de la estructura del BD.

96

3. Identificación de variables de contaminación petrolera.

4. Identificación de variables de la CEPAL.

5. Identificación de variables de la OMS

6. Análisis de variables de contaminación con investigadores del proyecto

MONOIL.

7. Análisis de variables de la CEPAL y OMS con desarrolladores de los WS del

grupo MONOIL.

8. Creación de estructura para BD de contaminación.

9. Creación de estructura para BD de las API CEPAL y OMS

10. Unificación de esquemas.

11. Análisis de las estadísticas de rendimiento de la base de datos.

12. Análisis de la propuesta de un sistema open Source de monitorio en el

servidor de BD PostgreSQL.

Descripción de Historias de Usuario

Se debe considerar las historias de usuarios encontradas y determinar cuál sería

su peso y prioridad según el equipo de trabajo haciendo uso de la técnica de

planificación póquer, para esta parte se consideró el tiempo que puede llevar el

desarrollo de cada historia, a continuación, se detallan las historias de usuarios

creadas.

Cuadro #20: Estándar de la base de datos

Número 1

Título Estándares aplicada a BD en PostgreSQL

Descripción Yo como administrador, necesito de

estándares de BD para tener un control

sobre los fuentes y estructuras.

Importancia para la

Empresa:

7

Esfuerzo: 5



97

Cuadro #21: Creación de la estructura del BD

Número 2

Título Estructura del BD

Descripción Yo como administrador, necesito de una

estructura de BD óptima para tener un mejor

rendimiento

Importancia para la

Empresa:

10

Esfuerzo: 8



Cuadro #22: Identificación variables de contaminación petrolera

Número 3

Título Identificación de variables de contaminación

petrolera.

Descripción Yo como administrador, necesito saber

cuáles serán las variables de contaminación

para determinar la validación del modelo

lógico y E/R implementado.

Importancia para la

Empresa:

10

Esfuerzo: 10



Cuadro #23: Identificación de variables de la CEPAL

Número 4

Título Identificación de variables de la CEPAL


cuáles serán las variables utilizadas para el

BD de la CEPAL para determinar la

validación del modelo lógico y E/R

implementado.

Importancia para la

Empresa:

10

Esfuerzo: 8



98

Cuadro #24: Identificación de variables OMS

Número 5

Título Identificación de variables de la OMS


cuáles serán las variables utilizadas para el

BD de la OMS para determinar la validación

del modelo lógico y E/R implementado.

Importancia para la

Empresa:

10

Esfuerzo: 8



Cuadro #25: Análisis de variables contaminación con investigadores del proyecto MONOIL

Número 6

Título Análisis de variables de contaminación con

investigadores del proyecto MONOIL.

Descripción Yo como administrador, necesito saber si

las variables usadas en la base de datos de

Contaminación son las correctas para que

puedan ser usadas al 100% por los

investigadores de MONOIL.

Importancia para la

Empresa:

8

Esfuerzo: 7



99

Cuadro #26: Análisis de variables de la CEPAL y OMS con desarrolladores WS

Número 7

Título Análisis de variables de la CEPAL y OMS

con desarrolladores de los WS del grupo

MONOIL

Descripción Yo como administrador, necesito saber si

las variables usadas en la base de datos de

la CEPAL y OMS son las correctas para que

puedan ser usadas al 100% por los

desarrolladores de los WS.

Importancia para la

Empresa:

7

Esfuerzo: 6



Cuadro #27: Creación de estructura para BD de contaminación petrolera

Número 8

Título Creación de estructura para BD de

contaminación

Descripción Yo como administrador, necesito la

implementación de las variables de

contaminación sobre una base de datos,

para ser usada por los investigadores de

MONOIL.

Importancia para la

Empresa:

9

Esfuerzo: 8



100

Cuadro #28: Creación de estructura para BS de las API CEPAL y OMS

Número 9

Título Creación de estructura para BD de las API

CEPAL y OMS

Descripción Yo como administrador, necesito la

implementación de las variables de la

CEPAL y OMS sobre una base de datos,

para ser usada por los desarrolladores de

los WS de MONOIL.

Importancia para la

Empresa:

8

Esfuerzo: 7



Cuadro #29: Unificación de esquemas

Número 10

Título Unificación de esquemas

Descripción Yo como administrador, necesito que los

esquemas creados por cada estructura

sean unificados para evitar caídas o

afectaciones entre los BD.

Importancia para la

Empresa:

6

Esfuerzo: 5



Cuadro #30: Análisis de las estadísticas de rendimiento

de la base de datos.

Número 11

Título Análisis de las estadísticas de rendimiento

de la base de datos.

Descripción Yo como administrador, necesito identificar

las consultas hacia la BD o sus estadísticas

para saber cuáles afectan su rendimiento.

Importancia para la

Empresa:

6

Esfuerzo: 6



101

Cuadro #30: Análisis de propuesta de un sistema de monitoreo en servidor de BD PostgreSQL

Número 12

Título Análisis de la propuesta de un sistema de

monitorio en el servidor de BD PostgreSQL

Descripción Yo como administrador, necesito saber si es

posible la futura implementación de un

sistema monitoreo de BD para analizar el

rendimiento y evitar afectaciones futuras.

Importancia para la

Empresa:

5

Esfuerzo: 8



REUNIÓN DE PLANEACIÓN DEL PROYECTO

Dentro de la metodología SCRUM existe la necesidad de agrupar las historias de

usuarios y desarrollar los Sprint para darle un orden de ejecución acorde a las

necesidades de los usuarios.

Cuadro #31: Reunión de planeación del proyecto

Historia de

usuario

Esfuerzo Importancia

para la

empresa

Esfuerzo

en horas

Sprint

Estándar base de

datos.

5 7 8 1

Creación de

estructura de BD.

8 10 6

Identificar variables

contaminación

petrolera.

10 10 72

Identificación de

variables CEPAL.

8 10 14

Identificación de

variables OMS

8 10 14

102

Análisis variables de

contaminación con

investigadores.

7 8 8

Análisis de variables

de la CEPAL y OMS

con desarrolladores

de los WS.

6 7 8

Creación de

estructura para BD

de contaminación.

8 9 48 2

Creación estructura

para BD de las API

CEPAL y OMS

7 8 32

Unificación de

esquemas.

5 6 8

Análisis de las

estadísticas de

rendimiento de la

base de datos.

6 6 10 3

Análisis de propuesta

de un sistema de

monitorio en servidor

de BD PostgreSQL.

8 5 8



103

Backlog del Sprint

Posterior a las reuniones con el líder del proyecto y los miembros desarrolladores

e investigadores del proyecto MONOIL los sprint que se usan quedan de la

siguiente manera:

Cuadro #32: Sprint MONOIL

Historia de

usuario

Esfuerzo Importancia

para la

empresa

Esfuerzo

en horas

Sprint

Estándar base de

datos.

6 8 8 1

Creación de

estructura de BD.

8 10 6

Unificación de

esquemas.

4 5 8

Identificar variables

contaminación

petrolera.

10 10 72 2

Análisis variables de

contaminación con

investigadores.

6 8 8

Creación de

estructura para BD

de contaminación.

9 9 48

Identificación de

variables CEPAL y

OMS

6 9 25 3


de la CEPAL y OMS

con desarrolladores

de los WS.

6 7 8

Creación estructura

para BD de las API

CEPAL y OMS

7 8 32

Análisis de las

estadísticas de

rendimiento de la

base de datos.

6 7 10 4

104

Análisis de propuesta

de un sistema de

monitorio en servidor

de BD PostgreSQL.

8 5 8



Diseño y Ejecución.

A continuación, se detalla la ejecución de cada Sprint usado en el proyecto.

Sprint 1

Cuadro #33: Historia de Usuario 1

Historia de

Usuario 1

Estándares aplicada a

BD en PostgreSQL

Esfuerzo en horas 6

Descripción Importancia para la

empresa

8

Yo como administrador, necesito de estándares de BD para tener un control

sobre los fuentes y estructuras.

Criterio de aceptación

Todas las estructuras creadas presentan el mismo estándar




Historia de

Usuario 2

Estructura del BD Esfuerzo en horas 8


empresa

10

Yo como administrador, necesito de una estructura de BD óptima para tener

un mejor rendimiento


La BD presenta la estructura cumpliendo con las reglas adecuadas de un

sistema actual.



105


Historia de

Usuario 3

Unificación de

esquemas

Esfuerzo en horas 4


empresa

5

Yo como administrador, necesito que los esquemas creados por cada

estructura sean unificados para evitar caídas o afectaciones entre los BD.


La BD utiliza un esquema general utilizado por los demás esquemas del

proyecto MONOIL.



Demostración del Sprint 1

Grafico # 19: Historia de Usuario 1 – Estándar BD

Elaborado: Pedro Villafuerte Yagual


106

Grafico # 20: Historia de Usuario 2 – Creación Esquemas



107

Grafico # 21: Historia de Usuario 3 – Esquema General



108

Sprint 2


Historia de

Usuario 4

Identificación de

variables de

contaminación

petrolera.

Esfuerzo en horas 10


empresa

10

El administrador, necesita saber cuáles serán las variables de

contaminación para determinar la validación del modelo lógico y E/R

implementado.


Se muestran las variables utilizadas en la investigación inicial.




Historia de

Usuario 5


de contaminación con

investigadores del

proyecto MONOIL.

Esfuerzo en horas 6


empresa

8

El administrador, necesita saber si las variables usadas en la base de datos

de Contaminación son las correctas para que puedan ser usadas al 100%

por los investigadores de MONOIL.


Se analizaron las variables y sufren pocos cambios respecto a la de los

investigadores del proyecto MONOIL.



109


Historia de

Usuario 6

Creación de

estructura para BD de

contaminación

Esfuerzo en horas 9


empresa

9

El administrador, necesita la implementación de las variables de

contaminación sobre una base de datos, para ser usada por los

investigadores de MONOIL.


Se muestra la estructura creada y si diagrama E/R.



Grafico # 22: Historia de Usuario 4 – Definición Variables



110

Grafico # 23: Historia de Usuario 5 – Validación de Variables



111

Grafico # 24: Historia de Usuario 5 – Generación dinámica de tablas



Grafico # 25: Historia de Usuario 6 – Ejecución de Job



112

Grafico # 26: Historia de Usuario 6 – Esquema CAM



113

Sprint 3


Historia de

Usuario 7

Identificación de

variables de la CEPAL

y OMS

Esfuerzo en horas 6


empresa

9

El administrador, necesita saber cuáles serán las variables utilizadas para

el BD de la CEPAL y OMS para determinar la validación del modelo lógico

y E/R implementado.






Historia de

Usuario 8


de la CEPAL y OMS

con desarrolladores

de los WS del grupo

MONOIL

Esfuerzo en horas 6


empresa

7

El administrador, necesita saber si las variables usadas en la base de datos

de la CEPAL y OMS son las correctas para que puedan ser usadas al 100%

por los desarrolladores de los WS.





114


Historia de

Usuario 9

Creación de

estructura para BD de

las API CEPAL y OMS

Esfuerzo en horas 7


empresa

8

El administrador, necesita la implementación de las variables de la CEPAL

y OMS sobre una base de datos, para ser usada por los desarrolladores de

los WS de MONOIL.


Se muestra la estructura y el diagrama de E/R



115

Grafico # 27: Historia de Usuario 7 – Validación de datos



116

Grafico # 28: Historia de Usuario 8 – Análisis de variables



117

Grafico # 29: Historia de Usuario 9 – Esquema API



118

Sprint 4

Cuadro #42: Historia de usuario 10

Historia de

Usuario 10

Análisis de las

estadísticas de

rendimiento de la

base de datos.

Esfuerzo en horas 6


empresa

7

El administrador, necesita identificar las consultas hacia la BD o sus

estadísticas para saber cuáles afectan su rendimiento.


Se muestra en la consola del servidor las estadísticas.




Historia de

Usuario 11

Análisis de la

propuesta de un

sistema de monitorio

en el servidor de BD

PostgreSQL

Esfuerzo en horas 8


empresa

5

El administrador, necesita saber si es posible la futura implementación de

un sistema monitoreo de BD para analizar el rendimiento y evitar

afectaciones futuras.


Se evidencia su funcionamiento.



119

Gráfico # 30: Historia de Usuario 10



Pruebas Finales

Culminada la creación de las estructuras creadas se las facilita a los

desarrolladores del proyecto MONOIL para el uso de los esquemas de las API de

la CEPAL y OMS, así como la base de datos a usar por los investigadores de

MONOIL y para la creación de reportes estadísticos dependiendo de las gráficas

que se quiera visualizar, cabe recalcar que esta base de datos albergar

información de contaminación mundial, datos socioeconómicos y de salud.

La implementación final de la base de datos es sobre los servidores de base de

datos que se encuentra en la carrera de Ing. en Networking y Telecomunicaciones

de la Universidad de Guayaquil.

120

Gráfico # 31: Historia de Usuario 11



Entregables del proyecto

Basados en la metodología utilizada que es SCRUM los entregables son los

descritos a continuación:

Matriz de Pruebas, el cual detallara las pruebas realizadas en la creación del

modelado de datos.

Manual técnico, el cual describe los procesos de instalación de los

componentes utilizados y los respaldos de la base de datos creada

Manual de Usuario, el cual describe como debe ser el uso del modelado de

datos para un fácil entendimiento por parte del usuario final, se denota el uso

correcto hacia las bases de datos de la CEPAL, OMS y de Contaminación

Ambiental.

121

Criterios de validación de la propuesta

Las bases de datos relacionales permiten acoplar varios esquemas entre sí, sin la

necesidad de alterar la información que estas contengan ni afectar su rendimiento

a medida que exista transaccionalidad, utilizando los pasos para una correcta

normalización de base de datos se construye una estructura general que es de

gran ayuda para los investigadores y desarrolladores del proyecto MONOIL.

En base a las entrevistas realizadas se evidencia que más del %85 de los

entrevistados concuerdan en que los métodos utilizados para obtener y definir la

estructura de los modelos de contaminación petrolera, modelos de la CEPAL y

OMS han brindado los esquemas necesarios que se muestra en los diagramas

E/R físico y que son acordes a las necesidades planteadas por el proyecto

MONOIL.

122

Criterios de aceptación del Producto o Servicio

Cuadro #44: Matriz de aceptación

REQUERIMIENTOS ACEPTACIÓN

Base de datos de

Contaminación petrolera en el

Ecuador hacia el aire, tierra,

agua, especies vivas.

Reducción de costos en las

investigaciones a realizar por el

fácil acceso a la información

requerida.

Base de datos de la CEPAL y

OMS

Fácil administración sobre

estos datos y consultas sobre

datos actualizados sin

necesidad de acudir a diversos

sistemas para monitorear la

información.

Estructura de base de datos

que se acople a la unificación

de las bases de datos de

CEPAL, OMS, y Contaminación

petrolera.

Fácil entendimiento sin alterar

la información entre los

distintos ambientes que pueden

existir a pesar de manejar los

datos en caliente.

Comprobar con otros miembros

del proyecto el uso de la base

de datos Unificada.

Las pruebas mostraron la

correcta funcionalidad de la

estructura implementada, a

pesar de ser invocada

mediante aplicaciones

separadas para acceder a cada

repositorio de datos.

Fuente: Datos de la Investigación.


123

Entre los informes de aseguramiento de calidad se detallan los siguientes puntos:

Documento de modelos de E/R de la base de datos de contaminación

petrolera, base de datos de la CEPAL y OMS.

Entrega de scripts de análisis y rendimiento del uso de la base de datos

Unificada.

Listado de índices utilizados para el correcto rendimiento de la base de datos

en momentos de mayor carga transaccional.

124

CONCLUSIONES Y RECOMENDACIONES

Conclusiones

La implementación del modelamiento de la BD incide positivamente a los

requerimientos de los investigadores de MONOIL por que permite definir una

estructura de fácil entendimiento capaz de acoplarse a diversas bases entre

la CEPAL, OMS, Contaminación petrolera hacia el aire, agua, tierra y

especies vivas.

Las variables definidas por los investigadores del proyecto MONOIL sobre

la contaminación petrolera en el aire, agua, tierra, especies vivas se

visualizan en el modelado de la base de datos creada se encuentra en una

estructura independiente para no afectar a los demás esquemas usados en

el proyecto MONOIL.

El modelo lógico implementado muestra la viabilidad de la estructura final

aplicada a la base de datos, permitiendo identificar el correcto uso de la

normalización aplicada.

El modelo entidad relación presenta una estructura legible que al ser

implementado no se ve afectada por la cantidad de registros que se ingresan

a la base de datos, lo evidenciado en la estructura indica que puede ser

expandible sin afectar a cada uno de los esquemas creados.

125

Recomendaciones

Al consumir esta base de datos es necesario que se analicen los datos que

se van a usar, en el caso de los sistemas externos de la CEPAL y OMS que

pueden brindar información irrelevante respecto a la contaminación

ambiental y que pueden afectar al rendimiento del gestor de base de datos.

Gestionar documentadamente las nuevas variables que se encuentren y no

perder el lineamiento que se ha estado siguiendo, si se crean módulos que

guarden relación con la base de datos MONOIL es preferible usar esquemas

individuales para liberar la carga transaccional.

Para futuras aplicaciones relacionados al proyecto MONOIL es preferible

mantener los usos de normalización para las nuevas estructuras de la base

de datos, pues mantener estos pasos permitirá brindar un modelo lógico

entendible en cada nueva estructura que se adicione en lo posterior.

A medida que aumente la data de las tablas de la base de datos del proyecto

MONOIL es recomendable hacer un análisis del diagrama entidad relación,

los índices creados y sus claves foráneas, es necesario hacer esta tarea ya

que la base de datos se puede volver pesada lo que afectara el rendimiento

de las consultas hacia la base de datos, y toda vez que las creaciones de

nuevas tablas pueden bajar los costes del uso a la base de datos.

126

BIBLIOGRAFÍA

Aguilera F., A., & Garcia M., L. D. (2011). RT-POSTGRESQL: EXTENSIÓN DE

POSTGRESQL PARA EL MANEJO DE DATOS CON FRECUENCIAS

TEMPORALES. scielo, 130-143. Bonell Rosabal, S. (2009). Petróleo y biotecnología: análisis del estado del arte

y tendenciasOil and biotechnology: analysis of the state of the art and

trends. Obtenido de scielo:

http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1024-

94352009000100003&lng=es&tlng=es

Bustamante, T., & Jarrín, C. (2004). Indicadores sociales y petróleo en la

Amazonía. flacsoandes, 1-38.

Bustamante, T., & Jarrín, C. (2011). Indicadores sociales y petróleo en la

Amazonía. flacsoandes, 1-38.

Cáceres Hernández, J. (2007). Conceptos básicos de estadística para ciencias

sociale. Madrid.

Casalet, M. (01 de 01 de 1998). google books. Obtenido de

https://books.google.com.ec/books?id=SSqDGtPR7T0C&dq=investiga

cion+aplicada+concepto&hl=es&source=gbs_navlinks_s

Consejo de Educacion Superior. (10 de septiembre de 2016). CES. Obtenido

de

http://www.ces.gob.ec/index.php?option=com_phocadownload&view=

category&id=11:ley-organica-de-educacion-superior&Itemid=137

Desiré Atangana, M., & Sepúlveda Lima, R. (2007). TRANSFORMACIÓN DE

ESQUEMAS RELACIONALES ORIENTADOS A OBJETOS: UN

ENFOQUE BASADO EN EL OBJETO. Ingeniería Industrial 2007

XXVIII(1), 66-72.

Díaz Silvera, J., & Martínez Silva, J. (2010). INTERFAZ PARA LA GESTIÓN

DE BASES DE DATOS TEMPORALES (IGBDT) V 1.0. Ciencia en su

PC 2010 (1), 47-56.

Díaz, J. R. (2009). Las metodologías ágiles como garantía de calidad del

software. Revista Española de Innovación, Calidad e Ingeniería del

Software, 1-43.

Espinal Martín, Y., & Puebla Martínez, M. E. (2010). Sistema para la integración

del proceso de normalización de bases de datos relacionales con

gestores de bases de datos (SINORGES). Avances en Sistemas e

Informática, 17-25.

Fuentes Tapia, L. (2010). INCORPORACIÓN DE ELEMENTOS DE

INTELIGENCIA DE NEGOCIOS EN EL PROCESO DE ADMISIÓN Y

MATRÍCULA DE UNA UNIVERSIDAD CHILENA. Ingeniare. Revista

Chilena de Ingeniería, 383-394.

García Ferrando, M. (1993). El análisis de la realidad social. Métodos y

técnicas de investigación. Madrid-España: Alianza Universitaria.

Gavilán, A., & Martínez, M. Á. (2004). La investigación en México en materia

de compuestos orgánicos persistentes. Gaceta Ecológica, 5-20.

Gil Rivera, M. d. (1994).

Gordas, J., Cardiel, N., & Zamorano, J. (2011). Estadística Básica para

Estudiantes de Ciencias. Madrid.

Greguas Navarro, D., & Hernández Claro, R. L. (2010). Estándares de Diseño

Web. Ciencias de la Información, 69-71.

127

Kuby, J. (2008). Estadística Elemental. Gengage Learning.

López Takeyas, B. (30 de Abril de 2016). Apuntes y Prácticas de Programación

Orientada a Objetos (C#). Obtenido de

http://www.itnuevolaredo.edu.mx/takeyas/apuntes/poo/

Malhotra, N. K. (2004). Investigación de mercados: un enfoque aplicado. En N.

K. Malhotra, Investigación de mercados: un enfoque aplicado (pág.

713). Pearson Educación.

Monoil / IRD - Monoil. (12 de Agosto de 2016). Es.monoil.ird.fr. Obtenido de

http://es.monoil.ird.fr/

MONOIL. (10 de junio de 2016). MONOIL (Monitore ambiental, salud, sociedad

y petróleo en Ecuador). Obtenido de http://es.monoil.ird.fr/

MONOIL. (10 de septiembre de 2016). MONOIL, convenios de cooperacion

firmados para el proyecto MONOIL. Obtenido de

http://es.monoil.ird.fr/content/view/full/199826

Moore, D. S. (2000). Estadística Aplicada Básica. Barcelona: Manuel Girona,

61 - 08034.

mysql-hispano. (29 de mayo de 2003). Normalización de bases de datos.

Obtenido de

http://www.eet2mdp.edu.ar/alumnos/MATERIAL/MATERIAL/info/infon

orma.pdf

OMPI. (10 de septiembre de 2016). LEY DE PROPIEDAD INTELECTUAL.

Obtenido de http://www.wipo.int/wipolex/es/text.jsp?file_id=195678

Ponce Talancón, H. (2007). La matriz foda: alternativa de diagnóstico y

determinación de estrategias de intervención en diversas

organizaciones. Enseñanza e Investigación en Psicología., 113-130.

Proyectos Agiles.org. (10 de septiembre de 2016). METODOS AGILES.

Obtenido de https://proyectosagiles.org/que-es-scrum/

Robles Aranda, Y., & R. Sotolongo, A. (2013). INTEGRACIÓN DE LOS

ALGORITMOS DE MINERÍA DE DATOS 1R, PRISM E ID3 A

POSTGRESQL. JISTEM: Journal of Information Systems and

Technology Management, 389-406.

Robles Aranda, Y., & R. Sotolongo, A. (2013). INTEGRACIÓN DE LOS

ALGORITMOS DE MINERÍA DE DATOS 1R, PRISM E ID3 A

POSTGRESQL. JISTEM: Journal of Information Systems and

Technology Management, 389-406.

Secretaria Nacional de la Administracion Publica. (10 de septiembre de 2016).

Software Libre. Obtenido de

http://www.administracionpublica.gob.ec/wp-

content/uploads/downloads/2014/06/DecretoEjecutivo1014.pdf

Sistema Nacional de Nivelacion y Admision. (10 de septiembre de 2016).

SNNA. Obtenido de http://www.snna.gob.ec/wp-

content/themes/institucion/dw-

pages/Descargas/regimen_academico.pdf

Triola, M. F. (2004). Estadística Novena Edición. México: Pearson Educación.

Vargas Sabadías, A. (1995). Estadística descriptiva e inferencial. En A. Vargas

Sabadías, Estadística descriptiva e inferencial (pág. 576). Madrid:

Universidad de Castilla-La Mancha.

Vargas Sabadías, A. (1995). Estadística Descriptiva e Inferencial. Castilla-La

Mancha: Servicio de Publicaciones de la Universidad de Castilla-La

Mancha.

128

Vladimirovna Panteleeva, O. (2002). Fundamentos de Probabilidad y

Estadística. Toluca.

Wolf Iszaevich, G. E. (2011). Monitoreo de PostgreSQL con Munin. Revista

Cubana de Ciencias Informáticas, 1-8.

Yuni, J., & Urbano, A. (2006). Tecnicas Para Investigar 2. Editorial Brujas.

Zwerg-Villegas, A. M., & Ramírez Atehortúa, F. H. (2012). Metodología de la

investigación:más que una receta. AD-minister, 91-111.

129

ANEXO 1

ENTREVISTA PROYECTO MONOIL

Esta entrevista es dirigida hacia los miembros líderes del proyecto MONOIL y

docentes investigadores que validen la propuesta del proyecto de Titulación sobre

el Análisis y Creación del modelo de Base de Datos para la gestión de las variables

que definen los modelos de contaminación ambiental en el aire, agua, tierra y

especies vivas dentro del proyecto de definición de escenarios de la

contaminación petrolera en Ecuador del programa MONOIL

1. ¿Creé usted que el método utilizado para la recopilación de información para

crear la base de datos ambiental y la base de datos de la CEPAL y OMS es

el correcto?

Totalmente de acuerdo


Indiferente



2. ¿De lo analizado en la base de datos, ¿Cómo usted considera el trabajo

investigado para le realización de la unificación de las Base de datos

ambientales petroleras, CEPAL, OMS, y el tiempo de respuesta al ser

consumidos por otros sistemas?

Excelente trabajo

Buen trabajo

Faltan pocos detalles

Trabajo inconcluso

Pésimo trabajo

130

3. Como usted considera el entendimiento del modelo de E/R aplicado a la base

de datos MONOIL para el uso de los investigadores?


Fácil entendimiento

Se entiende a medias

Difícil entendimiento

No se entiende nada

4. ¿Considera Usted que es entendible la estructura presentada sobre la base

de datos MONOIL o es necesario de un manual de usuario para tener un

entendimiento más claro y concisa?


Fácil entendimiento

Se entiende a medias

Difícil entendimiento

No se entiende nada

5. ¿Considera usted que separar la base de datos en varias estructuras

llamadas esquemas permite tener un mayor rendimiento al momento de

realizar consultas?

Totalmente de acuerdo


Indiferente



131

ANEXO 2

MANUAL DE USUARIO

El presente documento indica el uso que se debe dar a los esquemas

creados en la base de datos PostgreSQL y el entendimiento del uso de

estas.

Esquema AMG

Este esquema es de uso general para toda la aplicación, los elementos que

se presentan son los siguientes:

Tablas:

Anio: Indica los años que se usaran para la generación de los reportes.

Anio

anioId Integer detalle Integer estado Character (1)

PK_ANIOS PRIMARY KEY(“anioId”)

Canal: utilizado por las tablas para identificar a que esquema pertenecen.

Canal

CanalId Character (3) Detalle Character

varying(50) estado Character (1)

PK_ANIOS PRIMARY KEY(“canalId”)

132

Ciudad: identifica las ciudades que se utilizaran en el módulo.

Ciudad

CiudadId Integer EstadoId Integer descripcion Character (1)

estado Character (1)

PK_CIUDAD PRIMARY KEY(“ciudadId”)

FK_ESTADO_CIUDAD FOREIGN KEY(“estadoId”)

Estado: identifica los estados asociados a las ciudades que se utilizaran

en el módulo.

Estado

EstadoId Integer Descripción Character varying

(50) PaisId Integer

estado Character varying (1)

PK_ESTADO PRIMARY KEY(“estadoId”) FK_PAIS_ESTADO FOREIGN KEY(“paisId”)

Idioma: identifica los idiomas que se pueden configurar para los modulos

utilizados en el proyecto.

Idioma

IdiomaId Character (3) Detalle Character varying

(15) Estado Character varying

(1)

PK_IDIOMA PRIMARY KEY(“idiomaId”)

País: identifica los países que se pueden configurar para los módulos


Pais

paisId Integer Descripción Character varying

(15) Estado Character varying

(1)

PK_PAIS PRIMARY KEY(“paisId”)

133

Usuario: identifica los usuarios que se pueden configurar para los módulos


Usuario

UsarioId Bigserial Identificación Character varying

(15) Apellidos Character varying

(100) Nombres Character varying

(100) Nacionalidad Character varying

PaisId Integer

EstadoId Integer

CiudadId Integer

Teléfono Character varying

Telefonotrabajo Character varying

Email1 Character varying

Email2 Character varying

fechaNacimiento Date

PK_USUARIO PRIMARY KEY(“usuarioId”)

FK_CIUDAD_USUARIO FOREIGN KEY (“ciudadId”)

FK_ESTADO_USUARIO FOREIGN KEY (“estadoId”)

FK_PAIS_USUARIO FOREIGN KEY (“paisId”)

RegistrosAuditoria: almacena los log sean por errores o por notificaciones

presentes en el sistema.

RegistrosAuditoria

registroAuditoriaId smaillint descripcion Character varying

(2000) nivelRiesgoId smaillint

fechaCreacion Date

canalId character varying (5)

PK_REGISTROSAUDITORIA PRIMARY KEY(“registroAuditoriaId”) FK_REGISTROSAUDITORIA_01 FOREIGN KEY (“canalId”)

134

Esquema API

Este esquema es de uso general para los servicios web usados por la

CEPAL y OMS.

Categoria: tabla usada por la OMS para sus indicadores.

categoriaId int2

Descripción varchar(150)

dimensionId int2

DetalleAcumuladoCategoria: usa los detalles que se agrupan por los

indicadores de la OMS

detalleAcumuladoCategoriald int2

acumuladoCategoriald int2

Valor varchar(250)

Factld varchar(100)

Published varchar(100)

Dataset varchar(100)

fechaIngreso int2

fechaCaducudad int2

AcumuladoCategoria: contiene el valor de los indicadores de la OMS.

acumuladoCategoriald int2

Dimensionld int2

Categoriald int2

135

Dimension: detalla las dimensiones usadas por la CEPAL y OMS.

Dimensionld int8

descripcionIdiona1 varchar(250)

descripcionIdioma2 varchar(250)


Estado char1

Integradorld varchar(15

DetalleDimension: indica los detalles de las dimensiones que se utilizaran

en la CEPAL y OMS.

detalleDimensionld int8

Dimensionld int8

Orden int8

Estado char(1)

descripcionDetalleIdioma1 varchar(250)

descripcionDetalleIdioma2 varchar(250)

url varchar(250)

detalleDisplay varchar(250)

integradorld varchar(15)

ValorCategoriaDimension: es el valor que se mostraran en los reportes

se los agrupa por categoria y dimension usado generalmente por la OMS.

valorCategoriaDimensionld int2


Categoriald int2

Valor varchar(500)

DetalleDisplay varchar(250)

IndicadorDetaDimension: asocia los indicadores con los detalles de las

dimensiones usado por la CEPAL.

indicadorDetaDimensionld int8

Indicadorld int8


Indicador: se detallan los indicadores usados por la CEPAL.

Indicadorld int8

Estado char(1)


136


unidadIdioma1 varchar(100)

unidadIdioma2 varchar(100)

definicionUnidadIdioma1 varchar(300)

definicionUnidadIdioma2 varchar(300)

AreaIndicador: asocia las áreas con los indicadores usados por la CEPAL.

areaIndicadorld int8

Areald int8

Indicadorld int8

Notas: asocia las notas creadas por los investigadores de la CEPAL.

notald int8



DatoValorDimension: muestra los valores asociados a las dimensiones

utilizados por la CEPAL.

datoValorDimensionld int8

Fuenteld int8

Notald varchar(150)

nomenclaturaIso varchar(15)

indicadorDetaDimensionld int8

Valor varchar(250)

descripcionDatoIdioma1 varchar(150)

descripcionDatoIdioma2 varchar(150)

descripcionCalculoIdioma1 varchar(500)

descripcionCalculoIdioma2 varchar(500)

comentarioIdioma1 varchar(300)

comentarioIdioma2 varchar(300)

Aniold int4

Area: detalla las áreas que se asocian a los módulos de la CEPAL y agrupa

a los indicadores.

Areald int8



137

ArbolArea: agrupa las áreas para que puedan ser mostrados como árbol

por los reportes de la CEPAL.

ArbolAreald int8

Areald int8

subAreald int8

Estado char(1)

Temald int8

Fuente: Son las fuentes de dónde sacan la información los investigadores

de la CEPAL.

fuenteld int(8)

abreviatura varchar(10)

urlOrganizacion varchar(100)

urlPublicacion varchar(100)

organizacionIdioma1 varchar(250)

organizacionIdioma2 varchar(250)

descripcionPublicacionIdioma1 varchar(500)

descripcionPublicacionIdioma2 varchar(500)

ESQUEMA CAM

Este esquema alberga las variables investigadas para contaminación

ambiental.

138

UsoAgua: detalla los usos que se le pueden dar al agua sea contaminada

o pura.

usoAguald int2

Detalles varchar(150)

Estado char(1)

FactorClimatologico: factores que afectan al clima.

factorClimatologicoId int2


Clima varchar(150)

Estado char(1)

Etnias: etnias que están presentes en las tierras afectadas por la

contaminación ambiental.

etniasId int2


Estado char(1)

DetalleAfectacionDayuma: contiene los detalles que afectan a las tierras

de Dayuma.

detalleAfectacionDayumaId int8

bloqueId int2

tipoAmenazasId int2

etniasId int2

factorClimatologicoId int2

usoAguaId int2


fechaCreacion date

Estado char(1)

tipoSueloId int2

TipoSuelo: los tipos de suelos afectados.

tipoSueloId int2

tipoZonaId int2


texturaSuelo varchar(150)

coberturaVegetal varchar(250)

139

Estado char(1)

Ecosistema varchar(150)

TipoZona: Diferencia los tipos de zonas usados por los investigadores

tipoZonaId int2


estado char(1)

TipoAmenaza: son los tipos de amenazas que presentan los derrames del

petróleo.

tipoAmenazaId int2

detalles verchar(250)

estado char(1)

OrigenCompuesto: indica el origen de los compuestos que se presentan.

origenCompuestoId int2

detalles varchar(150)

Empresa: las empresas presentes en las zonas de afectación de Dayuma.

empresaId int2


estado char(1)

Bloques: son las zonas de afectación por los cuales se separan en la

amazonia para la explotación petrolera.

bloqueId int2

empresaId int2

numeroBloque varchar(50)

detallesBloque varchar(150)

ciudadId int2

TipoContencion: son los tipos de contención para determinadas zonas.

tipoContencionId int2

detalles vechar(250)

MuestreContaminacion: Detalla las formas de contaminación.

muestreoContaminacionId int8

140

orquestadorId int8

temperatura int2

cantidadMuestra numeric

metricaId int2

Profundidad int2

tipoZonaId int2

tiempoMonitoreo int2

tipoContencionId int2


Metricas: diferencia los tipos de medidas usados por los módulos.

metricaId int2

descripcionMedida varchar(50)

Abreviatura varchar(10)

Compuestos: son los compuestos que se usan para identificar los tipos de

petróleos.

compuestoId int2


Valor numeric

metricaId int2

Estado char(1)

NivelRiesgo: detalla que grado de peligrosidad se encuentran en los

contaminantes.

nivelRiesgoId int2


Orden int2

Estado char1

DetalleHaps: Agrupa los tipos de Haps que origina la contaminación.

detalleHaspId int2

detalleCompuestoId int2

nivelRiesgoId int2

DetalleCompuesto: agrupa los compuestos por su nivel de contaminación,


compuestoId int2

141

valorPorcentaje numeric

limiteMinimoPermitido numeric

LimiteMaximoPermitido numeric

tipoComponenteId int2

TtipoComponente: Describe los tipos de componentes.

tipoComponentesId int2


TipoPetroleo: agrupa los tipos de petróleos presentes en la

contaminación.

tipoPetroleoId int2

descripcion varchar(150)


API numeric

valor numeric

metricaId int2

TipoTemperatura: separa los tipos de temperaturas presentes en el agua,

aire, tierra.

tipoTemperaturaId char(1)

detalle verchar(50)

DetallePetroleo: identifica los tipos de petróleos que pueden agruparse.

DetallePetroleoId int8

tipoPetroleoId int8

detalleMetalId int8

Temperatura numeric

tipoTemperaturaId varchar(3)

TipoEsparcimiento: tipos de esparcimiento sobre la especie afectada.

tipoEsparcimientoId int2


Orquestador: Tabla principal que alberga todos los tipos de

contaminaciones posibles.

142

orquestadorId int2

enfermedadXespAfectadaId int2

detalleHaspId int2

semanasPresencia int2

nivelRiesgoId int2

detallePetroleoId int2

detalleMetalId int2

PH numeric

Toxidad numeric



fechaCreacionRegistro date

Densidad numeric

Salinidad numeric

Temperatura int2

porcentajeHumedad numeric

Altitud numeric

tiempoExposicion int2

barrilesDerramados int8

velocidadViento int2

conductividadElectrica int2

tipoTemperaturaId varchar(3)

superficieAfectada numeric

porcEfectividadContencion numeric

ciudadId int2

areaContaminacionId int2

causaAfectacionId int2

tipoMovimientoId int2

tipoEsparcimientoId int2

TipoMovimiento: los tipos de movimientos que se presentan en las olas

tipoMovimientoId int2


Metales: detalla los metales y su nivel de contaminación.

metalId int8

Detalle varchar(50)

abrPeriodica varchar(4)

Densidad int2

Salinidad int2

143

Estado char(1)

tipoMetalId int2

DetalleMetal: agrupa los contaminantes presentes por los metales.

detalleMetalId int2

metalId int2

Descrpcion varchar(250)

fechaCreacion date

TipoMetal: detalla los tipos de metales y su nivel de contaminación,

tipoMetalId int2


EspecieAfectada: indica las posibles especies afectadas por el nivel de

contaminación.

especieAfectadaId int2

Detalles verchar(250)

TipoEnfermedad: Detalla los tipos de enfermedades.

tipoEnfermedadId int2

Detalles varcgar(250)

CausaAfectacion: causas de la contaminación.

causaAfectacionId int2


AreaContaminacion: detalla el área de contaminación.

areaContaminacionId int2

detalles varchar(0)

144

Diagrama Lógico del esquema API

Diagrama E/R del esquema API

145

Diagrama Lógico del esquema CAM

146

Diagrama E/R del esquema CAM

147

Diagrama Lógico del esquema AMG

Diagrama E/R del esquema AMG

148

ANEXO 3

MANUAL TECNICO

En el presente manual se indica cómo se debe instalar los esquemas a utilizar

para los módulos de contaminación ambiental petrolera, indicadores de la CEPAL

y OMS, módulos generales. Los siguientes pasos se los debe realizar en la

herramienta pgAdmin III, en caso de no existir la Base MONOIL se la debe crear

siguiendo los pasos a continuación:

1. Clic derecho en la opción Databases y seleccionar New Database.

2. Escribir MONOIL en la opción NAME.

3. Una vez creada la base seleccionarla, dar clic derecho y luego en Restore.

149

4. Dar clic en botón Filename y seleccionar el archivo en donde está el

backup de MONOIL respaldoMONOIL.backup

5. Dar clic en el botón Restore.

6. Debe generar el siguiente resultado, posterior a eso clic en el botón Done.

150

7. Refrescar en la opción Shemas y se deben visualizar.

Ahora se va a insertar la data correspondiente a las estructuras creadas.

8. Repetir los puntos 3 y 4 pero en este caso se va a seleccionar el archivo

backup de la data de MONOIL.

9. En la pestaña Restore Options #1 seleccionar la opción Data y

posterior a eso clic en Restore.

151

10. Se mostrará un mensaje como el indicado a continuación y con eso

terminará la inserción de datos sobre las tablas.

11. Crear una carpeta en la unidad D:\ de nombre “Archivos” y copiar los

archivos logs.txt y conexión.txt

12. Dentro del archivo conexión.txt actualizar las credenciales de conexión

a la base de datos.

13. Ejecutar el .jar entregado myejecucion.jar