ALGORITMO CROMÁTICO APLICADO A UN MODELO DE …

120
ALGORITMO CROMÁTICO APLICADO A UN MODELO DE REGRESIÓN NO LINEAL EN PRONÓSTICOS DE SERIES DE TIEMPO JOSÉ ANTONIO AVILEZ PACHECO RAFAEL EMIRO SABIE LOBO. UNIVERSIDAD DE CÓRDOBA FACULTAD DE INGENIERÍA PROGRAMA DE INGENIERÍA SISTEMAS MONTERÍA - CÓRDOBA 2020

Transcript of ALGORITMO CROMÁTICO APLICADO A UN MODELO DE …

ALGORITMO CROMÁTICO APLICADO A UN MODELO DE REGRESIÓN NO

LINEAL EN PRONÓSTICOS DE SERIES DE TIEMPO

JOSÉ ANTONIO AVILEZ PACHECO

RAFAEL EMIRO SABIE LOBO.

UNIVERSIDAD DE CÓRDOBA

FACULTAD DE INGENIERÍA

PROGRAMA DE INGENIERÍA SISTEMAS

MONTERÍA - CÓRDOBA

2020

ALGORITMO CROMÁTICO APLICADO A UN MODELO DE REGRESIÓN NO

LINEAL EN PRONÓSTICOS DE SERIES DE TIEMPO

JOSÉ ANTONIO AVILEZ PACHECO

RAFAEL EMIRO SABIE LOBO.

Trabajo de grado presentado, en la modalidad de Trabajo de Investigación, como parte de

los requisitos para optar al Título de Ingeniero de Sistemas.

Director (s):

JORGE GÓMEZ, PDH.

UNIVERSIDAD DE CÓRDOBA

FACULTAD DE INGENIERÍA

PROGRAMA DE INGENIERÍA SISTEMAS

MONTERÍA - CÓRDOBA

2020

La responsabilidad ética, legal y científica de las ideas, conceptos y resultados del proyecto,

serán responsabilidad de los autores.

Artículo 61, acuerdo N° 093 del 26 de noviembre de 2002 del consejo superior.

Nota de aceptación

_______________________________

_______________________________

_______________________________

_______________________________

________________________________

Firma del jurado

________________________________

Firma del jurado

En honor al todo poderoso que brinda la sabiduría y

voluntad. A mi madre que ha sido motivo para este gran

logro. A mi compañera de vida Adriana y a mis hijos

Hannah y Maximiliano por ser mi apoyo y sustento

incondicional.

Rafael Emiro Sabie Lobo

Quiero dedicar esta tesis en primer lugar a Dios, sin

duda alguna hizo parte de mi proceso desde un inicio,

A mis padres William Aviles Montes e Iris Pacheco

Noble por ser el motor de mi vida.

A mis hermanos que siempre me dieron una

oportunidad de seguir creciendo.

A mis colegas y compañeros que conocieron mi pasión

por seguir construyendo mis sueños.

Jose Antonio Aviles Pacheco

Agradecimientos especial a:

Profesor Jorge Gómez por su acompañamiento en cada proceso del proyecto

Profesor Mario Macea por su acompañamiento y atención en los escaños del programa.

TABLA DE CONTENIDO

RESUMEN................................................................................................................................... 12

ABSTRACT ................................................................................................................................. 14

1. INTRODUCCIÓN ............................................................................................................. 16

1.1. PLANTEAMIENTO DEL PROBLEMA .......................................................................... 16

2. OBJETIVOS ...................................................................................................................... 20

2.1. Objetivo general ................................................................................................................. 20

2.2. Objetivos específicos ......................................................................................................... 20

3. JUSTIFICACIÓN .............................................................................................................. 21

4. ALCANCE Y LIMITACIONES ....................................................................................... 23

5. MARCO CONCEPTUAL ................................................................................................. 25

5.1. Algoritmia y Optimización de Metaheurísticas. ................................................................ 25

5.2. Pronósticos y Series de Tiempo. ........................................................................................ 33

6. ESTADO DEL ARTE........................................................................................................ 45

7. MATERIALES Y MÉTODOS. ......................................................................................... 56

8. OPTIMIZACIÓN DE PRONÓSTICOS ............................................................................ 59

8.3. Modelo de Regresión ..................................................................................................... 61

8.3.1. Optimización del Modelo ........................................................................................... 63

8.3.2. Función objetivo ......................................................................................................... 64

8.4. Codificación de Parámetros ........................................................................................... 65

8.5. Algoritmo Cromático ......................................................................................................... 66

8.5.1. Vecinos de escala cromática ....................................................................................... 67

8.5.2. Vecinos de Inspiración y de Rotación ........................................................................ 70

8.6. Parámetros y Pseudocódigo del Algoritmo Cromático .................................................. 74

9. RESULTADOS Y DISCUSIONES ................................................................................... 75

9.1.1. Problema de evaluación N°1 (Clase polinomial) ....................................................... 75

9.1.2. Problema de evaluación N°2 Clase (polinomial) ....................................................... 76

9.1.3. Problema de evaluación N°3 (Clase racional) ............................................................ 76

9.1.4. Problema de evaluación N°4 (Clase diversa) .................................................................... 77

10. CONCLUSIONES ............................................................................................................. 99

11. RECOMENDACIONES .................................................................................................. 101

12. BIBLIOGRAFÍA ............................................................................................................. 103

ANEXOS Y DIAGRAMAS APLICATIVO .......................................................................... 106

Pseudocódigo del algoritmo. ............................................................................................... 106

LISTADO DE ILUSTRACIONES

Ilustración 1 Clasificación de los modelos de pronóstico de series temporales. ......................... 34

Ilustración 2 Representación de una solución en el algoritmo Cromático. ................................. 65

Ilustración 3 Vecinos de Rotación descendentes ........................................................................ 72

Ilustración 4 Vecinos de Rotación ascendentes. ......................................................................... 73

LISTADO DE TABLAS

Tabla 1 Comparación de resultados problema N°1. ...................................................................... 1

Tabla 2 Comparación de resultados problema N°2. ...................................................................... 2

Tabla 3 Comparación de resultados problema N°3. ...................................................................... 3

Tabla 4 Comparación de resultados problema N°4. ...................................................................... 4

Tabla 5 Datos y resultados ganado tipo HV. ................................................................................. 1

Tabla 6 Comparación de resultados ganado tipo HV. ................................................................... 5

Tabla 7 Datos y resultados ganado tipo VE ................................................................................... 6

Tabla 8 Comparación de resultados ganado tipo VE. .................................................................. 10

Tabla 9 Datos y resultados ganado tipo TO. ................................................................................ 11

Tabla 10 Comparación de resultados ganado tipo TO. ................................................................ 15

LISTADO DE GRÁFICOS

Gráfico 1 Ajuste para el problema N°1 .......................................................................................... 1

Gráfico 2 Ajuste para el problema N°2. ......................................................................................... 2

Gráfico 3 Ajuste para el problema N°3. ......................................................................................... 3

Gráfico 4 Ajuste para el problema N°4. ......................................................................................... 4

Gráfico 5 Ajuste para el caso tipo HV ........................................................................................... 5

Gráfico 6 Ajuste para el caso tipo VE.......................................................................................... 10

Gráfico 7 Ajuste para el caso tipo TO.......................................................................................... 15

RESUMEN

El presente trabajo utiliza la nueva metaheurística, algoritmo cromático para la optimización de

pronósticos de series de tiempo a través de un modelo de regresión no lineal. En esta nueva

propuesta se maneja el algoritmo cromático debido a sus características de codificación real y a su

memoria de arranque múltiple, que le permiten ser más eficiente a la hora minimizar el error en

los pronósticos del modelo, para lograr esto se utilizan indicadores estadísticos del error que

contribuyen a mejorar las predicciones a cada problema específico.

Además, se idean unas mejoras al modelo de regresión y al algoritmo utilizado de tal manera que

se logra predecir el comportamiento de los problemas, no solo de una variable sino también de

múltiples variables. Hay que resaltar que el algoritmo es capaz de hacer que sus soluciones

cumplan con los supuestos o restricciones que son necesarias para poder hacer uso del modelo

estudiado. El algoritmo junto con el modelo es probado en distintos problemas de una y múltiples

variables proporcionando muy buenas predicciones. Además, se ejecuta en caso de estudio

practico relacionado con la estimación de los precios de ganado según su tipo en la región

estudiada. El desarrollo de este nuevo método genera más posibilidades para alcanzar que los

pronósticos se ajusten y para mejorar cualquier tipo predicción. Esta investigación proporciona

una nueva manera para minimizar los errores en los pronósticos y generar resultados de gran

calidad.

También demuestra que se permite establecer pronósticos tanto en problemas de una variable como

en los de múltiples variables, con tiempos computacionales razonables. Esta sería una excelente

estrategia para las innumerables empresas, entidades u organizaciones que requieren métodos

verdaderamente eficientes que les permitan tomar las mejores decisiones.

Palabras clave: Pronósticos, metaheurísticas, series de tiempo.

ABSTRACT

The present work uses the new metaheuristic, a chromatic algorithm for the optimization of time

series forecasts through a non-linear regression model. In this new proposal, the chromatic

algorithm is handled due to its real coding characteristics and its multiple boot memory, which

allow it to be more efficient when it comes to minimizing the error in the model's forecasts. To

achieve this, statistical error indicators are used. that help improve predictions for each specific

problem.

In addition, improvements are devised to the regression model and the algorithm used in such a

way that it is possible to predict the behavior of the problems, not only of one variable but also of

multiple variables. It should be noted that the algorithm is capable of making its solutions comply

with the assumptions or restrictions that are necessary to be able to make use of the studied model.

The algorithm together with the model is tested in different problems with one and multiple

variables, providing very good predictions. In addition, it is executed in a practical case study

related to the estimation of livestock prices according to their type in the studied region. The

development of this new method generates more possibilities to achieve that the forecasts are

adjusted and to improve any type of prediction. This research provides a new way to minimize

forecast errors and generate high-quality results.

It also shows that it is possible to establish forecasts in both single and multi-variable problems,

with reasonable computational times. This would be an excellent strategy for the countless

companies, entities or organizations that require truly efficient methods that allow them to make

the best decisions.

Key words: Forecasts, metaheuristics, time series.

1. INTRODUCCIÓN

1.1. PLANTEAMIENTO DEL PROBLEMA

• Descripción del problema

En la actualidad es crucial y de gran relevancia el desarrollo de nuevos algoritmos encaminados a

la optimización , todo esto con el objetivo de que se construyan ayuden a solucionar y resolver

problemas que se han considerados de gran complejidad o magnitud, ya sea debido a que estos

problemas posean gran cantidad de variables o por las innumerables restricciones que se

encuentren en los mismos ,de una u otra forma la necesidad de estas herramientas es inminente

para encontrar soluciones optimas en diferentes casos de optimización y a los distintos problemas

que en la actualidad lo requieran .

En el contexto que nos atañe, este tipo de algoritmos llamados metaheurísticas, son

verdaderamente necesarios para la realidad actual, ya que gracias a ellos se pueden encontrar

soluciones a muchos problemas que presentan diariamente y que son considerados imposibles de

resolver en cortos periodos de tiempo. Sin embargo, se están encontrando muchos inconvenientes,

limitaciones o restricciones al momento de hacer uso de estos, ya que sus aplicaciones en casos

reales están siendo muy afectadas debido a que estos algoritmos todavía requieren de un mayor

rendimiento y eficiencia en la búsqueda de sus resultados.

Así mismo, es oportuno indicar que las metaheurísticas existentes han sido de gran importancia

para resolver innumerables problemas de optimización, pero no obstante estás suelen ser muy

complicadas en su programación y manejo, algunas requieren un gran número de parámetros y de

un alto costo de tiempo computacional para alcanzar sus objetivos o para obtener una solución

factible en un modelo de programación. Así que se requiere de mucho conocimiento y estudio para

comprender claramente sus comportamientos, ventajas y desventajas, que implica lo uno o lo otro

o cuál es la mejor manera de elegir los parámetros que se van a utilizar en desarrollo de un

problema de optimización.

Es de aclarar que todos estos aspectos ocasionan gran inconformidad e inconvenientes al momento

de hacer uso de estos algoritmos y son algunos motivos por los cuales estos métodos de búsqueda

se les atribuye comúnmente cierto grado de complejidad y lo que origina que en la actualidad se

restrinja en cierta forma la aplicación de los mismos a muchos problemas actuales de optimización

que lo requieren.

Para el caso en concreto que nos interesa se debe decir que Las diferentes técnicas de modelación

y sus aplicaciones han logrado que se obtengan resultados muy importantes en los pronósticos de

series de tiempo. La determinación de un adecuado modelo y de los parámetros que proporcionen

el mejor ajuste en análisis de series de tiempo se ha convertido en un aspecto muy importante para

la ingeniería y las empresas. Los pronósticos han sido siempre un desafío crucial para las

organizaciones, estos son vitales en la toma de decisiones críticas, lo que ha originado que en las

últimas décadas los especialistas en el tema se hayan dedicado a desarrollar y mejorar los modelos

de pronósticos de series de tiempo. En estos modelos, la mayoría de los investigadores suponen

una relación lineal entre coeficientes de las variables explicativas del pronóstico.

Aunque la hipótesis lineal hace que sea más fácil manipular los modelos matemáticos, esto puede

conducir a la representación inadecuada de patrones que existen en el mundo real, en donde las

relaciones no lineales son más frecuentes. Debido a lo anterior es fundamental la determinación

del modelo que mejor se ajusta al proceso o a la situación, dado que esto permite realizar una mejor

planeación y control. El análisis de series de tiempo es entonces una herramienta muy importante

para el pronóstico del futuro a partir de datos históricos. Estos métodos se utilizan generalmente

cuando no hay mucha información sobre el proceso de generación de la variable subyacente y

cuando otras variables no proporcionan una explicación clara de la variable estudiada (Zhang G. ,

2003). Así que de esta manera y mediante el estudio de muchas variables relacionadas en conjunto,

a menudo se obtiene una mejor comprensión y un pronóstico más sólido y confiable.

Dado que han sido desarrolladas muchas técnicas para el análisis de series de tiempo (De Gooijer

& Hyndman, 2006) publicaron en una revista los métodos más utilizados en series de tiempos

durante los últimos 25 años, y en donde exponen que los métodos más populares son el promedio

móvil, la suavización exponencial y los métodos ARIMA. Todos estos métodos asumen relaciones

lineales entre coeficientes de las variables explicativas del pronóstico, lo que ocasiona que se

obtengan resultados de muy baja calidad, y en muchos casos esto puede conducir a imprecisiones

que causan problemas mayores. Un ejemplo típico es la tendencia de los indicadores económicos

los cuales, si se manejan con este tipo de relación, deben tratarse con mucho cuidado para no caer

en resultados imprecisos. (Tong, 1990) describe algunas de las principales desventajas de la

modelación lineal en el análisis de series de tiempo y la inhabilidad que tienen estos métodos para

explicar cambios repentinos en amplitudes largas o en intervalos de tiempos irregulares.

Todo lo anterior hace necesario que los modelos no lineales se han usados para el análisis datos

en aplicaciones del mundo real, sin embargo, la utilización de métodos alternativos para solucionar

distintos problemas con gran aproximación a tendencias naturales y con pocas restricciones han

sido muchos, pero por lo general los modelos no lineales se han notado en varios autores. Algunos

de estos métodos son por ejemplo la combinación de la estructura ARIMA con redes neuronales

por (Zhang G. , 2003), el uso de redes neuronales para pronósticos de series de tiempo trimestrales

por (Zhang & M., 2007) y seguidamente (Behnamian & Ghomi, 2009) realizaron un nuevo

modelo no lineal para pronósticos de series de tiempo a través de la metaheurística hibrida PSO-

SA. Este trabajo busca implementar la nueva metaheurístico algoritmo cromático en los

pronósticos de series de tiempo, se desarrollan distintos problemas de una variable a través de la

optimización de parámetros en el modelo de regresión no lineal propuesto por (Behnamian &

Ghomi, 2009).

• Pregunta de investigación

Dados cada uno de los anteriores planteamientos, se permite formular el siguiente interrogante:

¿una metaheurística basada en la escala cromática de las notas musicales aplicada a un modelo

regresión no lineal genera resultados con calidad en pronósticos de series de tiempo?

2. OBJETIVOS

2.1. Objetivo general

• Implementar el algoritmo cromático aplicado a un modelo regresión no lineal en pronósticos

de series de tiempo, alcanzando calidad en cada una de sus repuestas y que de igual forma

este no requiera de un alto costo de tiempo computacional.

2.2. Objetivos específicos

• Identificar y reconocer el modelo de regresión no lineal y los parámetros más importantes

del algoritmo de búsqueda, así como los valores o rangos que generan generen mejores

resultados en los problemas solucionados por este método estructural.

• Diseñar la codificación del algoritmo de búsqueda aplicado al modelo regresión no lineal

en pronósticos de series de tiempo para establecer el rendimiento y eficiencia del mismo.

• Aplicar el algoritmo y el modelo de regresión no lineal en ejercicios de alto rendimiento y

caso práctico de estudio de la región.

• Analizar las soluciones del modelo regresión no lineal en pronósticos de series de tiempo

a través del algoritmo de búsqueda y realizar una comparación de resultados.

3. JUSTIFICACIÓN

En contexto con el desarrollo de este trabajo cabe destacar que en la época en la que nos inmiscuye

existe un rápido crecimiento y desarrollo de nuevos algoritmos de búsqueda y de optimización en

todo el mundo, más que todo durante las últimas décadas. No obstante, estos siguen aún rezagados

con respecto a ciertos factores como la calidad de sus respuestas, costo de tiempo computacional,

rendimiento y eficiencia. Debido a esto y al constante afán que existe en la actualidad de solucionar

distintos problemas de optimización, se originan ciertas desventajas a la hora de aplicar estos

algoritmos en la realidad. Todo Esto dificulta aprovechar las posibilidades de mejora que generan

estos métodos de búsqueda.

Sin embargo, cabe resaltar que también existen ciertos algoritmos que se basan por lo general en

búsquedas evolutivas o en búsquedas de vecindad que brindan buenos resultados en sus soluciones.

Pero aun así está latente la necesidad de conseguir nuevos métodos de optimización que mejoren

aún más las soluciones y los resultados de estas metaheurísticas.

Es pertinente indicar que este proyecto de investigación busca a través de una nueva metaheurística

que se basa en la escala cromática de las notas musicales disminuir el efecto negativo de los

distintos factores que están limitando la efectividad y aplicabilidad de los distintos métodos de

búsqueda en los problemas de optimización, específicamente en pronósticos de series de tiempo,

tratando de alcanzar mejores respuestas y resultados con menor tiempo empleado.

Además, se pretende lograr implementar un modelo de regresión no lineal de manera innovadora,

que permita alcanzar óptimos resultados en cada una de sus soluciones, que contenga parámetros

claros y precisos que no dificulten su utilización. De lo que se colige que este estudio se

fundamenta entonces en la aplicabilidad de conceptos primordiales de programación y algoritmia

con el objetivo de hacer un uso eficiente de modelos de regresión no lineales en pronósticos de

series de tiempo.

4. ALCANCE Y LIMITACIONES

• Alcance

Esta investigación se centra en la implementación de un nuevo algoritmo de búsqueda, adoptando

un modelo de regresión no lineal y en la comparación de resultados con métodos convencionales

y/o diversos algoritmos. Además de un análisis de su rendimiento y eficiencia al ser evaluado en

los problemas de serias de tiempo.

• Problemas de Evaluación de Alta Complejidad

− Problema de evaluación N° 1 (Clase polinomial)

Este problema de evaluación tiene 82 datos y es conocido como ‘‘Fillip” y consta de 11

parámetros, el modelo es expuesto en la expresión (1).

𝑦 = 𝛽0 + 𝛽1𝑥 + 𝛽2𝑥2 + … + 𝛽9𝑥9 +𝛽10𝑥10 + 𝐸 (1).

− Problema de evaluación N° 2 Clase (polinomial)

Este problema de evaluación tiene 21 datos, es conocido como ‘‘Wampler4” y consta de 6

parámetros, el modelo es expuesto en la expresión (2).

𝑦 = 𝛽0 + 𝛽1𝑥 + 𝛽2 𝑥2 + 𝛽3 𝑥

3 + 𝛽4 𝑥4 + 𝛽5 𝑥

5 + 𝐸 (2).

− Problema de evaluación N° 3 (Clase racional)

Este problema de evaluación tiene 11 datos, es conocido como ‘‘MGH09”, y consta de 4

parámetros, el modelo es expuesto en la expresión (3).

𝑦 =𝛽1 (𝑥2+ 𝑥𝛽2)

𝑥2+𝑥𝛽3 + 𝛽4 (3).

− Problema de evaluación N° 4 (Clase diversa)

Este problema de evaluación tiene 154 datos, es conocido como ‘‘Bennett5”, y consta de 4

parámetros, el modelo es expuesto en la expresión (4).

𝑦 = 𝛽1 (𝑥 + 𝛽2)−1

𝛽3 + 𝐸 (4).

• Caso de Estudio Practico (Precios del Ganado tipos de Córdoba)

Se efectúa la estimación de precios para tipos de ganado seleccionados según datos históricos que

se asocian con variables de tipo ganado referenciado como lo son; peso, semana-mes y precios de

venta. En esta oportunidad se conviene sobre hechos de venta obtenidos a través de información

recolectada a partir de subasta ganadera Subastar S.A. de la ciudad de Montería- Córdoba.

El objeto aquí es implantar el algoritmo de búsqueda y el modelo no lineal de series de tiempo

para realizar ejercicio de pronóstico en tipos específicos de ganado, conforme a los datos

escogidos.

• Limitaciones

Se analizarán y compararán los resultados con información de literatura y métodos convencionales

en concordancia con los recursos tecnológicos, Lo referente, debido a las diferentes limitaciones

financieras y de tiempo en las que se incurren al revisar y estudiar artículos bibliográficos que

hagan referencia a diferentes algoritmos de búsqueda aplicados en la optimización.

5. MARCO CONCEPTUAL

5.1. Algoritmia y Optimización de Metaheurísticas.

• Algoritmia

Para entender el concepto de este término partimos desde el origen del mismo el cual lo aclara

Valenzuela, (Ruiz, 2003) El origen del término algoritmo se remonta al siglo IX y se le atribuye

su invención al matemático árabe Abu Ja’far Muhammad ibn Musa al-Khwarizmi. El trabajo de

Al- Khwarizmi permitió preservar y difundir el conocimiento de los griegos e indios. De los

primeros, rescató la rigurosidad, mientras que de los últimos rescató la simplicidad. Una de las

principales contribuciones del Al-Khwarizmi fue la de hacer de las matemáticas una ciencia

práctica, capaz de ser entendidas por cualquier persona no experta en la materia.

Por lo general, el concepto de algoritmia es asociado generalmente a problema computacionales o

lenguajes de programación, sin embargo, éste es un concepto que tiene aplicabilidad en las

actividades más simples de la vida cotidiana. (Ruiz, 2003)

De la manera más simple, un algoritmo es una serie finita de pasos para resolver un problema, el

cual incluye sin excepción una secuencia finita de pasos y debe ser capaz de encontrar la solución

del problema o en su defecto avisar explícitamente que dicho problema no tiene solución.

(INACAP, 2003).

Los algoritmos deben tener las siguientes características:

− Entrada: Definir lo que necesita el algoritmo, es decir, los elementos útiles para la ejecución

del algoritmo, como datos, relaciones, instrucciones.

− Salida: Definir lo que produce el algoritmo, expresando claramente que resultados se

obtendrán al final de la ejecución de los pasos.

− No ambiguo: explícito, siempre sabe qué comando ejecutar, en un algoritmo no puede

haber confusión, no pueden llamarse dos cosas diferentes con el mismo nombre.

− Finito: El algoritmo termina en un número finito de pasos.

− Correcto: Hace lo que se supone que debe hacer. La solución es correcta

− Efectividad: Cada instrucción se completa en tiempo finito. Cada instrucción debe ser lo

suficientemente básica como para que en principio pueda ser ejecutada por cualquier

persona usando papel y lápiz.

− General: Debe ser lo suficientemente general como para contemplar todos los casos de

entrada.

Usualmente para resolver los problemas cotidianos no se necesita especificar el algoritmo de

solución, puesto que este se utiliza casi mecánicamente, como, por ejemplo; encender el

computador, realizar una multiplicación, entre otros. Sin embargo, para problemas más amplios y

complicados, como puede ser el hallar la solución a un sistema de variables, se necesita especificar

el algoritmo para asegurar mejores resultados.

Cabe resaltar que un problema puede tener muchos algoritmos a través de los cuales se puede

resolver, y en esta medida, a fin de determinar cuál es mejor, se deben tener en cuenta la cantidad

de recursos como tiempo y espacio que requieran para resolver el problema.

De esta forma, el mejor algoritmo será aquel capaz de manejar conjuntamente la eficacia y la

eficiencia; Donde la Eficiencia es el logro de los objetivos planteados utilizando la menor cantidad

de recursos posibles, es decir, minimizando el uso de memoria, de pasos y de esfuerzo humano.

Por su parte la Eficacia es alcanzar el objetivo primordial, es decir, obtener la solución buscada

por medio del análisis del mismo”. (Silver, 2004)

• Aspectos Generales Sobre Heurísticas y Metaheurísticas

La idea más genérica del terminó heurístico está relacionada con la tarea de resolver

Inteligentemente problemas reales usando el conocimiento disponible. El termino heurística

proviene de una palabra griega con un significa- do relacionado con el concepto de encontrar y se

vincula a la supuesta exclamación eureka de Arquímedes al descubrir su famoso principio.

En Inteligencia Artificial (IA) se emplea el calificativo heurístico, en un sentido muy genérico,

para aplicarlo a todos aquellos aspectos que tienen que ver con el empleo de conocimiento en la

realización dinámica de tareas. Se habla de heurística para referirse a una técnica, método o

procedimiento inteligente de realizar una tarea que no es producto de un riguroso análisis formal,

sino de conocimiento y experto sobre la tarea. En especial, se usa el terminó heurístico para

referirse a un procedimiento que trata de aportar soluciones a un problema con un buen

rendimiento, en lo referente a la calidad de las soluciones y a los recursos empleados. (Melian,

J.A.Moreno, & Moreno, 2003)

En la resolución de problemas específicos han surgido procedimientos heurísticos exitosos, de los

que se ha tratado de extraer lo que es esencial en su éxito para aplicarlo a otros problemas o en

contextos más extensos. Como ha ocurrido claramente en diversos campos de la IA, en especial

con los sistemas expertos, esta línea de investigación ha contribuido al desarrollo científico del

campo de las heurísticas y a extender la aplicación de sus resultados. De esta forma se han

obtenido, tanto técnicas y recursos computacionales específicos, como estrategias de diseño

generales para procedimientos heurísticos de resolución de problemas.

Estas estrategias generales para construir algoritmos, que quedan por encima de las heurísticas, y

van algo más allá, se denominan Metaheurísticas. Las metaheurísticas pueden integrarse como un

sistema experto para facilitar su uso genérico a la vez que mejorar su rendimiento.

El término metaheurística apareció por primera vez en el artículo seminal de Fred Glover acerca

Búsqueda Tabú en 1986. A partir de entonces, se han publicado gran cantidad de artículos e

investigaciones sobre procedimientos que intentan resolver ciertos problemas, que luego son

generalizados, convirtiéndose así en metaheurísticas. La relevancia de las metaheurísticas se

refleja en la publicación de libros sobre este campo en los últimos años, Diversos artículos de

revisión, monográficas y volúmenes especiales sobre metaheurísticas han venido apareciendo en

diversas colecciones editoriales o revistas periódicas de los campos de Investigación Operativa,

Inteligencia Artificial, Ingeniera y Ciencias de la Computación.

Además, en estas publicaciones se observa un incremento considerable del número de trabajos

que incluyen procedimientos heurísticos en los que se realizan planteamientos estándares de las

metaheurısticas. Desde 1985 se viene publican- do la revista Journal of Heuristics que concentra

una parte importante de las publicaciones en este campo. (Melian, J.A.Moreno, & Moreno,

2003)

• Heurísticas

Un concepto de muy claro sobre heurística es el citado por E.A Silver (Silver, 2004) quien dice

que heurística es un método el cual, sobre la base de la experiencia o el juicio, parece probable

obtener una solución razonable a un problema, pero la cual no puede garantizar obtener o alcanzar

la solución matemáticamente óptima. Ello implica, que las heurísticas son mecanismos por medio

de los cuales se da solución a un problema puntual, pero cuyos resultados no pueden llamarse

óptimos, dado que la heurística en sí misma no lo garantiza.

Mientras que, Melián, Moreno y Moreno dicen (Melian, J.A.Moreno, & Moreno, 2003) heurístico

es el calificativo apropiado para los procedimientos que, empleando conocimiento acerca de un

problema y de las técnicas aplicables, tratan de aportar soluciones (o acercarse a ellas) usando una

cantidad de recursos (generalmente tiempo) razonable. En un problema de optimización, aparte

de las condiciones que deben cumplir las soluciones factibles del problema, se busca la que es

óptima según algún criterio de comparación entre ellas.

• Metaheurísticas

El termino Metaheurísticas, se obtiene de anteponer a heurística el sufijo meta que significa “más

allá” o “a un nivel superior” (Melian, J.A.Moreno, & Moreno, 2003). Los conceptos actuales de

lo que es una metaheurística están basados en las diferentes interpretaciones de lo que es una forma

inteligente de resolver un problema. Las metaheurısticas son estrategias inteligentes para diseñar

o mejorar procedimientos heurísticos muy generales con un alto rendimiento.

Otro concepto muy importante es la de, Osman (1995), define: “Dentro de la clase denominada

metaheurística se incluyen todos aquellos procedimientos que, en un proceso iterativo, guían a

una heurística subordinada combinando inteligentemente diferentes conceptos tomados de la

analogía de la naturaleza, y exploran el espacio de soluciones utilizando estrategias de

aprendizaje para estructurar la información, con el objeto de encontrar eficientemente soluciones

cercanas al óptimo”.

También podemos complementar un poco más la definición en lo afirmado a continuación, las

metaheurísticas son estrategias inteligentes para diseñar o mejorar procedimientos heurísticos muy

generales con alto rendimiento (Melian, J.A.Moreno, & Moreno, 2003), de otra forma, se puede

decir que las metaheurísticas son procedimientos generales que exploran el espacio de solución

para problemas de optimización y búsqueda, éstos procedimientos, tienen la virtud de ser

adaptables a cualquier tipo de problemas y a contextos específicos a fin de proporcionar nuevos

algoritmos de solución. (Melian, J.A.Moreno, & Moreno, 2003).

• Tipos De Metaheurísticas

Los tipos de Metaheurísticas se establecen, en función al tipo de procedimientos a los que se

refiere. Así, algunos de los tipos fundamentales de metaheurísticas son: metaheurísticas para

métodos de relajación, procesos constructivos, procesos de búsqueda por entornos y

procedimientos evolutivos. (Melian, J.A.Moreno, & Moreno, 2003)

− Metaheurísticas de relajación: Se refieren a procedimientos de resolución de problemas que

utilizan relajaciones del modelo original, es decir, modificaciones del modelo que hacen al

problema más fácil de resolver, cuya solución facilita la solución del problema original.

− Metaheurísticas Constructivas: Se orientan a los procedimientos que tratan de la obtención

de una solución a partir del análisis y selección paulatina de las componentes que la forman.

− Metaheurísticas de Búsqueda: Guían los procedimientos que utilizan transformaciones o

movimientos para recorrer el espacio de soluciones alternativas y explotar las estructuras de

entornos asociadas.

− Metaheurísticas Evolutivas: Están enfocadas a los procedimientos basados en conjunto de

soluciones que evolucionan sobre el espacio de soluciones.

Cabe anotar, que algunas metaheurísticas han surgido de la combinación de varias metaheurísticas

de diversos tipos, así como hay otras, que no se incluyen claramente en ninguno de los tipos antes

mencionados. (Melian, J.A.Moreno, & Moreno, 2003)

E.A Silver (1980) y Zanakis (1989), proponen otros tipos de metaheurísticas, que no son más que

tipos intermedios entre las antes nombradas (Melian, J.A.Moreno, & Moreno, 2003). Las más

destacadas son:

− Metaheurísticas de descomposición: Establecen pautas para resolver un problema

determinando subproblemas a partir de los que se construye una solución del problema

original. Se trata de metaheurísticas intermedias entre las de relajación y construcción, ya que

se refieren básicamente a las características que se pretenden obtener en los subproblemas y a

cómo integrar las soluciones de éstos en una solución del problema original. El objetivo

fundamental es obtener subproblemas significativamente más fáciles de resolver que los

originales, y cuyas soluciones puedan ser utilizadas efectivamente.

− Metaheurísticas de memoria a largo plazo: Se sitúan entre las metaheurísticas de arranque

múltiple y las derivadas de búsqueda tabú, las cuales, a su vez, forman parte de las

metaheurísticas de búsqueda.

5.2. Pronósticos y Series de Tiempo.

• Pronósticos y Series de Tiempo.

En esta sección se ilustra sobre el marco de soporte de algunos modelos usados en la literatura para

representar tanto el modelo matemático subyacente de las series temporales como los modelos

usados en el pronóstico. Para un mejor entendimiento, se muestran en la ilustración N.º 1, los

métodos más usados en la literatura para pronóstico de series temporales.

Ilustración 1 Clasificación de los modelos de pronóstico de series temporales.

Fuente: (Rodríguez Rivero, 2016)

• Pronósticos

− Pronóstico: Es la predicción de la evolución de un proceso o de un hecho futuro a partir de

criterios lógicos o científicos. El término predicción puede referirse tanto a la acción y al efecto de

predecir como a las palabras que manifiestan aquello que se predice; en este sentido, predecir algo

es anunciar por revelación, ciencia o conjetura algo que ha de suceder. En términos estadísticos,

el pronóstico es el proceso de estimación en situaciones de incertidumbre (Brockwell & Davis,

2010). El término predicción es similar, pero más general, y usualmente se refiere a la estimación

de series temporales o datos instantáneos. La predicción es un problema importante que abarca

muchos campos, incluyendo todas las ciencias, los negocios, la industria, el gobierno, la economía,

la política y las finanzas. Los problemas de predicción a menudo se clasifican en corto, mediano

plazo y largo plazo. Los problemas a corto plazo implican la predicción de eventos sólo en períodos

de tiempo (días, semanas, meses) dependiendo del problema (Box, Jenkins, & Reinsel, 2015.). El

término mediano plazo se extiende de uno a dos años en el futuro, y la predicción a largo plazo

puede extenderse más allá. Por lo general pensamos en un pronóstico como un simple número que

representa nuestra mejor estimación del valor futuro de la variable de interés. (Rodríguez Rivero,

2016)

Algunos métodos causales de pronóstico asumen que es posible identificar los factores

subyacentes que pueden tener influencia sobre la variable a pronosticar (Shumway & Stoffer,

2011). Si estas causas se entienden, se pueden hacer proyecciones de las variables que influyen,

para utilizarlas en la predicción. Algunos de estos métodos son (Hastie, Tibshirani, & Friedman,

Springer):

− Análisis de la regresión, que puede ser lineal o no lineal.

− Modelo autorregresivo de media móvil (ARMA)

− Modelo ARIMA

− Econometría.

• Series de Tiempo

Se llama Series de Tiempo a un conjunto de observaciones sobre valores que toma una variable

(cuantitativa) en diferentes momentos del tiempo. Los datos se pueden comportar de diferentes

formas a través del tiempo, puede que se presente una tendencia, un ciclo; no tener una forma

definida o aleatoria, variaciones estacionales (anual, semestral, etc). Las observaciones de una

serie de tiempo serán denotadas por Y1,Y2,...,YT , donde Yt es el valor tomado por el proceso en el

instante t.

Los modelos de series de tiempo tienen un enfoque netamente predictivo y en ellos los pronósticos

se elaborarán sólo con base al comportamiento pasado de la variable de interés. Podemos distinguir

dos tipos de modelos de series de tiempo [fi] (RÌos, 2008).

− Modelos deterministas: se trata de métodos de extrapolación sencillos en los que no se hace

referencia a las fuentes o naturaleza de la aleatoriedad subyacente en la serie. Su simplicidad

relativa generalmente va acompañada de menor precisión. Ejemplo de modelos deterministas son

los modelos de promedio móvil en los que se calcula el pronóstico de la variable a partir de un

promedio de los ”n” valores inmediatamente anteriores.

− Modelos estocásticos: se basan en la descripción simplificada del proceso aleatorio subyacente

en la serie. En término sencillos, se asume que la serie observada Y1, Y2, YT se extrae de un grupo

de variables aleatorias con una cierta distribución conjunta difícil de determinar, por lo que se

construyen modelos aproximados que sean útiles para la generación de pronósticos. (RÌos, 2008)

− Serie de tiempo: se define como un conjunto de observaciones sobre valores que toma una

variable (cuantitativa) en diferentes momentos del tiempo. Los datos se pueden comportar de

diferentes formas a través del tiempo (Brockwell & Davis, 2010), esto es que presente una

tendencia, un ciclo; no tener una forma definida o aleatoria, variaciones estacionales (anual,

mensual, etc.). Una serie temporal puede estar constituida solo por eventos determinísticos,

estocásticos o una combinación de ambos (Chatfield, 2004). Se sabe que muchas series temporales

presentan comportamientos dinámicos no lineales, cuya complejidad hacen que sea imposible

formular un modelo matemático basado en leyes físicas o económicas que representen su

evolución adecuadamente. El problema de la formulación del modelo se ve agravado por la

presencia de observaciones atípicas y cambios estructurales, para los cuales no existen modelos

matemáticos que permitan su representación en el caso no lineal (Kantz & Schreiber, 2009 ).

Los métodos tradicionales para el análisis de series temporales (Kantz & Schreiber, 2009 ) se hacen

a través de la descomposición de las mismas en varias partes. Se dice que una serie temporal puede

descomponerse en tres componentes que no son directamente observables, de los cuales

únicamente se pueden obtener estimaciones. Estos tres componentes son:

Tendencia: representa el comportamiento predominante de la serie. Esta puede ser definida no

formalmente como el cambio de la media a lo largo de un extenso período de tiempo.

Estacionalidad: es un movimiento periódico que se producen dentro de un periodo corto y

conocido. Este componente está determinado, por ejemplo, por factores climáticos. Aleatorio: son

movimientos erráticos que no siguen un patrón específico y que obedecen a causas diversas. Este

componente es prácticamente impredecible. Estos comportamientos representan todos los tipos de

movimientos de una serie temporal que no son tendencia ni variaciones estacionales ni

fluctuaciones cíclicas. (Rodríguez Rivero, 2016)

− Redes Neuronales Artificiales: Los RNAs estudiadas en esta tesis son los perceptrones

multicapa (MLP), principalmente las redes neuronales con retardo de tiempo (TDNN). Se sabe

bien que las redes neuronales artificiales (RNA) son aproximadores universales de funciones, y

que no requieren un conocimiento a priori sobre el proceso en cuestión. Las RNAs también son

bien conocidas por su capacidad para modelar sistemas no lineales. Estas propiedades son

exactamente por las que son usadas en esta tesis en la modelización de series temporales no

lineales con naturaleza desconocida o muy compleja, es decir, son muy atractivas como

herramientas para predicciones de series temporales. La aplicación de las RNAs a la predicción

con series temporales no es nueva. Desde hace décadas existen numerosos trabajos al respecto,

siendo probablemente los más conocidos los de Werbos (Werbos, 1974), Lapedes, Weigend

(Weigend, Huberman, & Rumelhart, 1990). Desde la estadística, Box y Jenkins [5] desarrollaron

la metodología de los modelos autorregresivos integrados de promedios móviles (ARIMA) para

ajustar una clase de modelos lineales para series temporales. Posteriormente surgieron versiones

robustas de modelos ARIMA y de series temporales no lineales (Zhang G. , 2003) tendientes a

resolver los problemas que introducen la presencia de valores aberrantes o extremos en los datos.

Más recientemente, las RNAs han sido consideradas como una alternativa para modelar series

temporales no lineales. Los modelos de RNAs se ajustan tradicionalmente por mínimos cuadrados

y por lo tanto carecen de robustez en presencia de valores extremos o aberrantes (outliers). Como

algunos de los procedimientos que tratan con RNAs surgen como una generalización natural de

los modelos estadísticos lineales AR y ARMA al caso no lineal NAR y NARMA, los

procedimientos para ajustar las RNAs suelen estar relacionados con los procedimientos

empleados para modelar series temporales robustas. (Rodríguez Rivero, 2016)

− Métodos de Aprendizaje: El aprendizaje es un proceso fundamental de las RNAs y de forma

general, consiste en el ajuste de todos los parámetros de la red, en base a la actividad para la que

se quiera utilizar dicha red. Partiendo de un conjunto de pesos aleatorios, el aprendizaje busca un

conjunto de pesos que permita a la RNA, desarrollar una tarea determinada. El aprendizaje es un

proceso iterativo, en el que la red, va refinando sus parámetros, para alcanzar el objetivo de la

aplicación concreta que se intenta abordar. Las redes perceptrón multicapa (MLP) utilizan una

función de error que mide su rendimiento actual, en función de sus pesos. El aprendizaje se

convierte en un proceso de búsqueda de aquellos pesos que hagan mínima dicha función (Yu,

Efe, & Kaynak), (Alsmadi, Omar, Noah, & A., 2009). El aprendizaje no supervisado es un método

donde un modelo es ajustado a las observaciones. Se distingue del aprendizaje supervisado dado

que no hay un conocimiento a priori. En el aprendizaje no supervisado se hace un tratamiento de

los datos de entrada como un conjunto de variables aleatorias, siendo construido un modelo de

densidad para el conjunto de datos. El aprendizaje no supervisado puede ser usado en conjunto

con la Inferencia bayesiana para producir probabilidades condicionales (es decir, aprendizaje

supervisado) para cualquiera de las variables aleatorias dadas (Alsmadi, Omar, Noah, & A.,

2009). En cambio, el aprendizaje supervisado normalmente funciona mucho mejor cuando los

datos iniciales son primero traducidos en un código factorial. El aprendizaje no supervisado

también es útil para la compresión de datos: fundamentalmente, todos los algoritmos de

compresión dependen tanto explícita como implícitamente de una distribución de probabilidad

sobre un conjunto de entrada. (Rodríguez Rivero, 2016)

− Evaluación del desempeño predictivo: Medición del error

Para la evaluación del desempeño predictivo se emplean diferentes indicadores que cuantifican

qué tan cerca está la variable pronosticada de su serie de datos correspondiente. Una de las medidas

más utilizadas es el Promedio del Error Porcentual Absoluto (MAPE). (RÌos, 2008)

El RMSE mide la dispersión de la variable simulada en el curso del tiempo, penalizando

fuertemente los errores grandes al elevarlos al cuadrado. Esta característica hace que el RMSE se

recomiende cuando el costo de cometer un error es aproximadamente proporcional al cuadrado de

dicho error.

No siempre el modelo que genere pronósticos con un menor MAPE generará los pronósticos con

el menor RMSE y viceversa, por lo que en la selección de los mejores modelos de pronóstico se

hace necesario establecer la medida de error a utilizar para la elaboración del ranking de

desempeño. (RÌos, 2008)

Dado que una mala estimación del precio fututo del cobre se traduce en una pérdida de ingresos

proporcional al tamaño del error, el MAPE, y no el RMSE, parece ser la medida de desempeño

más adecuada. A esto se suma la ventaja práctica del MAPE de no requerir ser acompañado por la

media para dimensionar la magnitud del error. Luego, la medida de error que se empleará para

identificar los modelos de mejor desempeño será el MAPE.[fi]. (RÌos, 2008)

− Estimación de la Tendencia: Hay varios métodos para estimar la tendencia T(t), uno de ellos es

utilizar un modelo de regresión lineal. Se pueden utilizar otros tipos de regresiones, como regresión

cuadrática, logística, exponencial, entre otros.

Una forma de visualizar la tendencia es mediante suavizamiento de la serie. La idea central es

definir a partir de la serie observada una nueva serie que filtra o suaviza los efectos ajenos a la

tendencia (estacionalidad, efectos aleatorios), de manera que podamos visualizar la tendencia.

(Rodríguez Rivero, 2016)

− Promedio Móvil: Este método de suavizamiento es uno de los más usados para describir la

tendencia. Consiste en fijar un número k, preferentemente impar, como 3, F, etc., y calcular los

promedios de todos los grupos de k términos consecutivos de la serie. Se obtiene una nueva serie

suavizada por promedios móviles de orden k. De este modo se tienden a anular las variaciones

aleatorias.

El suavizamiento de media móvil es muy fácil de aplicar, permite visualizar la tendencia de la

serie. Pero tiene dos inconvenientes: No es posible obtener estimaciones de la tendencia en

extremos y no entrega un medio para hacer predicciones. Si la serie presenta un efecto estacional

de período k, es conveniente aplicar un suavizamiento de media móvil de orden k. En tal caso se

elimina el efecto estacional, junto con la variación aleatoria, observándose solamente la tendencia.

− Suavizamiento Exponencial: Este modelo se basa en que una observación suavizada, en tiempo

t, es un promedio ponderado entre el valor actual de la serie original y el valor de la serie suavizada,

en el tiempo inmediatamente anterior. Si Y (t) representa la serie de tiempo original, y Z(t) la serie

de tiempo suavizada. (Rodríguez Rivero, 2016)

− Aplicaciones de Series de Tiempo

Hoy en día diversas organizaciones requieren conocer el comportamiento futuro de ciertos

fenómenos con el fin de planificar, prevenir, es decir, se utilizan para predecir lo que ocurrirá con

una variable en el futuro a partir del comportamiento de esa variable en el pasado. En las

organizaciones es de mucha utilidad en predicciones a corto y mediano plazo, por ejemplo, ver

qué ocurriría con la demanda de un cierto producto, las ventas a futuro, decisiones sobre inventario,

insumos, etc.

Algunas de las áreas de aplicación de Series de Tiempo son (RÌos, 2008):

• Economía: Precios de un artículo, tasas de desempleo, tasa de inflación, índice de precios,

precio del dólar, precio del cobre, precios de acciones, ingreso nacional bruto, etc.

• Meteorología: Cantidad de agua caída, temperatura máxima diaria, Velocidad del viento

(energía eólica), energía solar, etc.

• Geofísica: Series sismológicas.

• Química: Viscosidad de un proceso, temperatura de un proceso.

• Demografía: Tasas de natalidad, tasas de mortalidad.

• Medicina: Electrocardiograma, electroencéfalograma.

• Marketing: Series de demanda, gastos, utilidades, ventas, ofertas.

• Telecomunicaciones: Análisis de senales.

• Transporte: Series de tráfico

6. ESTADO DEL ARTE

En el trascurrir del tiempo muchos tipos de metaheurísticas surgido con el fin de ser usadas para

mejorar diferentes tipos de problemas de gran complejidad o magnitud. Estos métodos de van

desde búsquedas de vecindad hasta las evolutivas, así como la combinación de las mismas.

A continuación, se mencionan algunas de los métodos de búsqueda más importantes y

representativos de los últimos años.

En 2004 surge una metaheurística muy popular propuesta por Kang Seok Lee a, Zong Woo Geem

en su artículo, “A new structural optimization method basedon the harmony search algorithm”, en

el cual Se explica claramente que este método se basa en una memoria armónica para alcanzar el

perfecto estado de la armonía. Esta búsqueda se basa en una HS memoria armónica inspirada en

la aleatoriedad para mejorar sus búsquedas por gradientes. No necesita de parámetros iniciales y

se resalta la gran eficacia para resolver problemas en ingeniería de estructuras. (Kang Seok & Zong

woo, 2004)

En el año 2005 Sebastián Urrutia, Irene Loiseau trabajan en “A New Metaheuristic and its

Application to the Steiner Problems in Graphs” un algoritmo llamado (SN) que pertenece al tipo

de metaheurísticas de descomposición debido a que esta se fundamenta en la división de un

problema en subproblemas más sencillos que son solucionados por una heurística doble que realiza

diferentes procedimientos dependiendo de si la condición de solución sea asumida como “si” o

como “no” para cada uno de los casos. Luego se construye una mejor solución por medio de la

asignación de un valor confidencial que se obtiene de la diferencia entre de la calidad de las

soluciones obtenidas por “si” y por “no” en cada iteración (Sebastian Urrutia, 2005)

Otros tipos de método surge en 2005 presentado por E. K. Burke, P. Cowling, J.D. Landa Silvae

en su trabajo “HYBRID POPULATION-BASED METAHEURISTIC APPROACHESFOR THE

SPACE ALLOCATION PROBLEM” este estudio me llama mucho la atención porque se centra en

un híbrido de la competencia metaheurísticas para el problema de la asignación de espacio lo cual

se hace muy llamativo y además tiene gran aplicación.

Este artículo muestra que una metaheurística híbrida basada en la población por el espacio es un

problema de asignación que se presenta en base a experimentos anteriores con una serie de técnicas

incluidas en escalada, recocido simulado, búsqueda tabú y algoritmos genéticos. Buscando con

ellos tener mejores características de cada técnica mencionada, y así parámetros estén acorde a

las características y problemas y además que supere el rendimiento de estas técnicas estándar. Esta

nueva propuesta utiliza métodos de heurísticos de búsqueda local para mejorar sus resultados,

además se realiza una parametrización automática acorde a las características del problema que

genera soluciones con calidad superior a las de los estándares de las distintas técnicas conocidas.

(Burke, Cowling, & Landa silva, 2006)

Otro trabajo importante fue publicado en 2007 por Nader Azizi, Saeed Zolfaghari and Ming Liang,

“A New Meta-heuristic Approach for Combinatorial Optimization and Scheduling Problems”.

Este trabajo muestra un nuevo y eficiente heurístico razonablemente la combinación de diferentes

características de varias heurísticas con recocido simulado.

A diferentes de otros algoritmos híbridos, la componente central de la heurística propuesta es una

simulación recocida que se beneficia de dos memorias a corto plazo.

Información acerca de las soluciones anteriores iteración mejor es conservado en una larga lista

población a largo plazo de la memoria llamada. Sabemos que un operador de cruce genético se

utiliza para producir nuevos la población que usa las soluciones almacenadas en la memoria de

otros en su momento.

Se tiene que el rendimiento del algoritmo es evaluado en comparación con los resultados

obtenidos por otros siete incluidos los métodos de algoritmos exactos, las técnicas generales y

algoritmos híbridos. Se comparan los resultados claramente indica que el algoritmo puede

encontrar mejores soluciones en algunos casos. Este algoritmo propuesto, debido a su generalidad,

se puede aplicarse fácilmente a otros problemas de optimización. Para el caso de la programación

de la tienda de trabajo, la calidad de las soluciones y la eficiencia computacional del algoritmo

puede ser mejorar mediante el uso barrio de problemas específicos estructura y los operadores más

eficientes. (Nader & Zolfaghari, 2007)

En el 2008 aparece una nueva metaheurística de tipo evolutivo viral system planteado por Pablo

Cortés, José M. García, Jesús Muñuzuri y Luis Oneiva, es un método que hace uso de una analogía

biológica inspirada en la ejecución e infección de los virus, más específicamente del Phagocyte.

En este enfoque, se considera que los virus son parte de una infección general, donde cada virus

trata de comportarse a su beneficio, pero a la vez en el beneficio del Viral System. (Cortes, Garcia,

Muñusuri, & Onieva, 2008)

El método parte de que en la naturaleza los virus son organismos que tienen su mayor éxito

cuando atacan células poco saludables, de ahí entonces el estado de salud es representado por F(x),

es decir la función objetivo.

El virus que pretende infectar una célula y replicarse a través de ella puede hacerlo de dos maneras;

la primera se denomina replicación lítica e implica la adherencia del virus al borde de la célula y

la inyección de su ADN, a partir de ese momento se generan varias copias, llamadas Nucleus

Capsids del virus dentro de la célula, los cuales son liberados cuando el número de réplicas llegue

a un nivel máximo y la pared de la célula infectada se rompa. La otra manera de replicarse se

denomina Lisogénica; aquí el virus infecta a la célula alojándose en su genoma y permanece allí

hasta que alguna causa externa provoque la réplica (Cortes, Garcia, Muñusuri, & Onieva, 2008)

En 2009 Alireza Tajbakhsh,, Kourosh Eshghi, Azam Shamsr proponen un hibrido entre el método

de optimización enjambre de partículas y el recocido simulado en este trabajo, “A Hybrid PSO-SA

Algorithm For The Traveling Tournament Problem” se presenta un nuevo modelo matemático

utilizando Programación y además propone un híbrido algoritmo que combina metaheurística PSO

y SA. En este papel se demostró que el híbrido propuesto algoritmo conduce a soluciones que son

comparables u obtiene mejor horario para las instancias de norma y que garantiza resultados de

buena calidad.

MOBAIS, es un novedoso algoritmo desarrollado por Pablo A.D Castro y Fernando J. von Zuben

en el año 2009, que puede ser utilizado como herramienta para solución de problemas multi-

objetivo, y cuya principal aporte es el adecuado manejo de soluciones parciales de alta calidad

(Building Blocks), que pueden estar codificadas en los anticuerpos que representan la solución, las

cuales en los algoritmos tradicionales inmune inspirados pueden llegar a ser destruidas por los

operadores de mutación y clonación.

Según Castro y Von Zuben, los algoritmos inmunes inspirados (AIS) presentan mecanismos para

evolucionar la población, que no tienen en cuenta las relaciones entre las variables del problema,

lo cual causa la destrucción de estas soluciones parciales de alta calidad.

En MOBAIS, los operadores de mutación y clonación son reemplazados por un modelo

probabilístico, más precisamente una red bayesiana, la cual representa la distribución de

probabilidad conjunta de las soluciones más prometedoras, y subsecuentemente, usa dicho modelo

para el muestreo de nuevas soluciones (Castro & V, 2008)

Un Nuevo hibrido simulado recocido surge en 2010 presentado por Stephen C.H.Leung,

DefuZhang, ChangleZhou , TaoWuc en su publibacion, “A hybrid simulated annealing

metaheuristic algorithmforthetwo-dimensional knapsack packing problema”. En este trabajo se

realiza un hibrido entre el recocido simulado y una heurística constructiva. La heurística greddy o

voraz aquí propuesta combinada con el SA proporcionan excelentes resultados en la solución de

problemas planteados en el artículo, además se destaca la rapidez y eficacia del método. (Leung &

DefuZhang, 2010)

Posteriormente surge en 2009, otro método que mejora a la optimización de enjambre de partículas

propuesto por A.J. Nebro, J.J. Durillo, J. Garc´ıa-Nieto, C.A. Coello Coello, F. Luna and E. Alba

en su trabajo “SMPSO: A New PSO-based Metaheuristicfor Multi-objective Optimization”. Este

estudio describe SMPSO, un PSO nuevo multi-objetivo algoritmo que tiene como objetivo

incorporar un mecanismo de constricción velocidad. Con esto se puede obtener Mediante su uso,

la velocidad máxima de las partículas es limitada con el fin de aumentar la capacidad de búsqueda

de la técnica. Esta nueva propuesta ha sido valorada según las dos familias de referencia, ZDT y

DTLZ, y compararon con cinco algoritmos de optimización de esta técnica multi-objetivo: NSGA

– II, SPEA2, OMOPSO, ABYSS Y MOCELL. Estos resultados demostraron que SMPSO supera

las limitaciones de los algoritmos que se ha comparado.

Este articulo muestra nuevos esquemas para la actualización de la velocidad de las partículas, y

aplicar SMPSO se investiga con el fin de demostrar un nuevo multi-objetivo algoritmo de

optimización de enjambre de partículas (PSO), caracterizada por el uso de una estrategia para

limitar la velocidad de las partículas.

Las características de SMPSO incluyen el uso de la mutación polinomio como un factor de

turbulencia y un archivo externo para almacenar las soluciones no dominadas encontradas durante

la búsqueda. (A.J. Nebro, 2009)

Con relación al análisis de series de tiempo para la predicción de los precios del ganado Córdoba

- Colombia se identifica en el año 2007 el trabajo “Estacionalidad, ciclos y volatilidad en los

precios del ganado macho de levante en Montería, Colombia” realizado por Omar Castillo

(Castillo, Estacionalidad, ciclos y volatilidad en los precios del ganado macho de levante en

Montería, Colombia, 2007). En su desarrollo se describe el comportamiento temporal de los

precios del ganado vivo macho de levante de primera calidad en la ciudad de Montería, Colombia

comercializado en las subastas. Materiales y métodos. Se realizaron análisis de los precios

semanales y mensuales durante el período 1997-2006 utilizando técnicas estadísticas y

econométricas como la media móvil multiplicativa, la tasa de crecimiento sobre medias anuales,

12 T12, y modelos auto-regresivos heterocedásticos condicionales, ARCH, o GARCH. Como

resultado se denota evidencias de estacionalidad y ciclos en los precios mensuales; no hubo

evidencia de comportamientos volátiles en precios semanales de los ganados de 1,1¼ y 1½ años

de edad, pero si para los de 1 año.

En este mismo año también se encontró el trabajo “Comportamiento temporal de los precios del

ganado macho de levante de primera en Sincelejo” (Castillo, Comportamiento temporal de los

precios del ganado macho de levante de primera en Sincelejo, 2007). De manera similar el autor

Omar Castillo señala que igualmente el comportamiento temporal de los precios del ganado vivo

macho de levante de primera calidad en la ciudad de Sincelejo, comercializado en las subastas.

Para ello se acude al análisis de los precios mensuales y semanales durante el período 1997 - 2006

utilizando técnicas estadísticas y econométricas como la media móvil multiplicativa, la tasa de

crecimiento sobre medias anuales, 12 T12 , y modelos auto- regresivos heterocedásticos

condicionales, ARCH, o GARCH. Los resultados indican la presencia de estacionalidad y ciclos

en los precios mensuales; en los precios semanales de las edades de 1 y de 1¼ año se observaron

comportamientos volátiles, el precio de los de 1½ año se han movido dentro de rangos estables.

Seguidamente se destaca el trabajo realizado por Botero y Cano en 2008, en su trabajo “Análisis

de series de tiempo para la predicción de los precios de la energía en la bolsa de Colombia”. En

este se realiza un análisis del comportamiento del precio de la energía eléctrica ha incrementado

su volatilidad, reflejando el riesgo existente para los diferentes agentes que intervienen en el

mercado. El objetivo de este artículo es presentar una metodología para la implementación de

modelos de regresión, sobre la serie histórica de precios de bolsa de energía en Colombia (Botero

& Cano, 2008).

En el año 2014 se identifica la investigación “Uso de un modelo univariado de series de tiempo

para la predicción, en el corto plazo, del comportamiento de la producción de carne de bovino en

Baja California, México”. Esta fue desarrollada por Barreras, Sánchez y Figueroa en Baja

California, México. Se utilizó el modelo autorregresivo de promedios móviles ARMA. Los

resultados respaldan el modelo para obtener a corto plazo predicciones de producción de carne en

baja california (Barreras Serrano, Eduardo, & Figueroa Saavedra, 2014).

De manera más reciente de encuentra la investigación titulada “Descripción y pronóstico de la

producción de carne de bovino en el estado de Tabasco”. Esta misma fue efectuada en el año 2017

por Espinosa, Vélez, Quiroz, Granados, Moctezuma y Casanova en México obedeciendo los

siguientes objetivos. Analizar el comportamiento y productividad de la producción de carne de

bovino en Tabasco y encontrar un modelo de series de tiempo capaz de realizar un pronóstico de

la producción, confiable, cercano a los valores de la serie, cuya correlación sea estadísticamente

significativa, se integró una serie de tiempo anual de producción de carne en canal (PCaCa),

animales sacrificados (ASac) y peso en canal (PeCa) de los ASac en los 17 municipios del estado

para el periodo 2006-2015. También se integró una serie mensual de PCaCa de enero de 2003 a

marzo de 2017. Bajo este precedente se encontró que Tabasco produce en promedio por año 65

338 ton de carne con 310 564 ASac con un peso promedio de 211 kg.

También se encontró que tanto la PCaCa, como los ASac presentaron TMAC positivas para el

estado, siendo el DDR de Villahermosa el de mayor dinamismo, con una tasa de crecimiento

promedio de 2 %; y el municipio de Teapa el de a mayor TCMA, con 4,4 %. El modelo de serie

de tiempo que mejor predice la PCaCa fue el autorregresivo integrado de promedio móvil, ARIMA

(p, d, q) (P, D, Q) k, de orden 1, por tanto, la producción de carne en Tabasco tiene un

comportamiento estacional. Se concluye que el modelo seleccionado permite hacer un pronóstico

cercano a la realidad con una confiabilidad estadística significativa. (Espinosa, Vélez, & A., 2017)

Revisando lo más reciente en la literatura del ámbito colombiano encontramos el trabajo

“Determinantes del precio del ganado gordo bovino en pie de Medellín y Bogotá: 2009-2019”.

Este fue elaborado por Sebastián López Nieto en la Universidad EAFIT - Escuela De Economía y

Finanzas. Este trabajo deja en evidencia las dinámicas, entre 2009 y 2019, que rigen los precios

del ganado bovino macho y hembra entre los principales mercados de carne en Colombia; ya que

permite entender de mejor manera el mercado bovino como oferta final de los frigoríficos, lo cual

afecta directamente las decisiones de gran cantidad de agentes que comercian en él. Entender la

dinámica de este mercado, termina impactando positivamente los ganaderos y los frigoríficos.

(Lopez, 2019)

Los ganaderos al tener más y mejor información, pueden mejorar su productividad, beneficiando

su calidad de vida. Por parte de los frigoríficos, con mejor información se puede impulsar de mejor

manera la competitividad del sector, que promete ser clave en los próximos años en materia de

exportaciones. Además, con lo hablado con ambos frigoríficos, es de gran información estos

estudios acerca de los precios y es una manera como estos puedan ayudarles a tomar mejores

decisiones a los agentes.

Des la óptica de lo investigado se señala que es claro que para determinar el precio del ganado

bovino macho hay 3 aspectos claves para tomar, de acuerdo con la literatura y la experiencia. Estos

son el factor del ciclo ganadero, tomando como índice el precio y la dinámica del ganado hembra

y cómo este afecta el macho, que en últimas es el que va principalmente a conformar la carne

suministrada a los consumidores. El segundo factor tiene que ver con lo asociado directamente al

precio del ganado macho entre ciudades, por medio de periodos anteriores cómo estos pueden

afectar el precio en el largo plazo. Por último, la forma en que las precipitaciones como factor

exógeno afectan el precio del ganado en ambas ciudades. (Lopez, 2019)

7. MATERIALES Y MÉTODOS.

• Metodología del Proyecto

Para la realización del proyecto se llevó a cabo la siguiente metodología; revisión bibliográfica,

selección del modelo de regresión no lineal, diseño e implementación de la metaheurística y de

indicador estadístico de error para la optimización de los problemas relacionados. Se ejecutarán

diferentes corridas para los ejercicios de alta complejidad, de conformidad con la Programación y

validación del modelo de regresión no lineal. Finalmente se realizará un estudio caso práctico en

problemas de series de tiempo, así mismo se procederá analizar las soluciones el modelo propuesto

utilizando el algoritmo cromático con sus respectivas soluciones estándares y según resultados.

Es de destacar que para el respectivo análisis de parámetros del algoritmo y con el propósito de

alcanzar en la metaheurística propuesta excelentes resultados se realizaron alguna serie de pruebas

y se tuvieron en cuenta experimentos de la literatura para garantizar la escogencia de los mejores

parámetros posibles. También se acudió al diseño con efectos fijos para evaluar el factor algoritmo

y el rendimiento de este según trabajos consultados previamente. Todo lo referente según

parámetros escogidos en la generación de buenos resultados con la aplicación de un número

razonable de pruebas, con fundamento en lo descrito en el libro de experimentos (Montgomery,

2004).

− Material y Método

En la realización del proyecto se procedió a precisar sobre: Revisión bibliográfica, selección del

mejor modelo, selección de la mejor metaheurística y del mejor indicador estadístico de error para

la optimización de los problemas relacionados. Se elaboró utilizaron los mejores parámetros del

algoritmo y una vez encontrados estos valores se procedió a la Programación y validación del

modelo, para ello fue necesario equipo de cómputo con procesador Intel Inside Core I3- 2.40 GHz,

el uso del software de análisis numérico GNU Octave, versión 4.4.1. en el cual fue codificado el

modelo y se hizo la respectiva validación para comprobar la veracidad de los datos arrojados.

Finalmente se realizó un estudio en tres grupos de problemas de una variable que son considerados

de alto grado de dificultad en la literatura, de los cuales se seleccionaron 4, para comparar el

modelo propuesto con sus respectivas soluciones estándares. No obstante, se prueba esta propuesta

en un problema de múltiples variables.

− Diseño De Experimentos

Este diseño inicia con la concepción o generación con preliminares condiciones en la las cuales

debe tratarse el sistema que se está abarcando, todo esto hace con el fin la garantizar la aleatoriedad

del dentro da la realización de corridas de datos, para disminuir el efecto de variables que no se

pueden controlar. Obteniendo, así como resultado de esta etapa la generación de los valores de los

factores controlables del sistema estudiado.

Seguidamente se examina las respuestas que se encuentran con la modelación diseñada y se realiza

así el análisis correspondiente, teniendo en cuenta la literatura relacionado con el algoritmo de

búsqueda y la región de estudio; implementando los parámetros básicos del algoritmo cromático

y modelo de estudio. (Montgomery, 2004).

Utilizando este tipo de metodología en esta investigación tendríamos que estudiar las

dos fases fundamentales para la ejecución de esta propuesta. En la primera etapa se destinó a la

fijación de los valores de los parámetros y su posterior análisis, se ratificó la veracidad del valor o

los rangos más importantes para cada parámetro.

Posteriormente en la última etapa se deben realizaron pruebas corridas pertinentes para evaluar el

desempeño del algoritmo, así como un profundo un análisis tomando los resultados de nuestro

programa con el de los diferentes métodos a comparar y con los problemas de series de tiempo

seleccionados.

8. OPTIMIZACIÓN DE PRONÓSTICOS

8.1. Ejercicios Problemas de Evaluación de Alta Complejidad

Para el desarrollo de la ruta esbozada, inicialmente se parte de la realización de ejercicios y

análisis de Problemas de Evaluación de Alta Complejidad identificados en la literatura

relacionada con pronósticos; con el objetivo de corroborar el potencial de trabajo del algoritmo

cromático, con ocasión de la búsqueda de respuestas en problemas de optimización en series

de tiempo.

En relación con lo anotado seguidamente se procede a señalar el listado de problemas que se

evaluarán en la parte inicial de este trabajo.

− Problema de evaluación N° 1 (Clase polinomial)

Este problema de evaluación tiene 82 datos y es conocido como ‘‘Fillip” y consta de 11

parámetros, el modelo es expuesto en la expresión (1).

𝑦 = 𝛽0 + 𝛽1𝑥 + 𝛽2𝑥2 + … + 𝛽9𝑥9 +𝛽10𝑥10 + 𝐸 (1).

− Problema de evaluación N° 2 Clase (polinomial)

Este problema de evaluación tiene 21 datos, es conocido como ‘‘Wampler4” y consta de 6

parámetros, el modelo es expuesto en la expresión (2).

𝑦 = 𝛽0 + 𝛽1𝑥 + 𝛽2 𝑥2 + 𝛽3 𝑥

3 + 𝛽4 𝑥4 + 𝛽5 𝑥

5 + 𝐸 (2).

− Problema de evaluación N° 3 (Clase racional)

Este problema de evaluación tiene 11 datos, es conocido como ‘‘MGH09”, y consta de 4

parámetros, el modelo es expuesto en la expresión (3).

𝑦 =𝛽1 (𝑥2+ 𝑥𝛽2)

𝑥2+𝑥𝛽3 + 𝛽4 (3).

− Problema de evaluación N° 4 (Clase diversa)

Este problema de evaluación tiene 154 datos, es conocido como ‘‘Bennett5”, y consta de 4

parámetros, el modelo es expuesto en la expresión (4).

𝑦 = 𝛽1 (𝑥 + 𝛽2)−1

𝛽3 + 𝐸 (4).

8.2. Caso de Estudio Practico (Precios del Ganado tipos de Córdoba)

En la segunda parte de los problemas propuestos para solucionar, se efectúa la estimación de

precios para tipos de ganado seleccionados según datos históricos que se asocian con variables de

tipo ganado referenciado como lo son; cantidad, mes y precios de venta. En esta oportunidad se

conviene sobre hechos de venta obtenidos a través de información recolectada a partir de subasta

ganadera Subastar S.A. de la ciudad de Montería- Córdoba.

El objeto aquí es implantar el algoritmo de búsqueda y el modelo no lineal de series de tiempo

para realizar ejercicio de pronóstico en tipos específicos de ganado, conforme a los datos

escogidos.

8.3. Modelo de Regresión

Los modelos de regresión son usados para encontrar un mejor ajuste a un conjunto de datos. El

propósito en todo tipo de regresión es tener la forma de la expresión (1). Para una serie de datos

en donde Y es la variable dependiente medida para un experimento y X es la variable independiente

que es cambiada durante los experimentos.

y = f(x) + ℰi (1)

F es una función que describe la relación de X y Y, y consta de uno o más parámetros. ℰi es la i-

esima observación del error que proviene de un nivel medio de datos que tiene una distribución

normal con media de cero. El modelo que se utilizó para realizar el ajuste a los datos en los

problemas que se trabajan en este artículo es el propuesto por (Behnamian & Ghomi, 2009) y se

expone a continuación en las expresiones (2) y (3).

𝑓(𝑥) =𝑓1 (𝑥)

𝑐1 + 𝑐2 ( 𝑓1 (𝑥)+ 𝑐3 𝑥 ln( 𝑏0+ ∑ 𝑏𝑖 5𝑖=1 𝑥𝑎𝑖 ))

(2)

En donde 𝑓1 (𝑥) es:

𝑓1 (𝑥) = 𝑏0 + ∑ 𝑏𝑖 5𝑖=1 𝑥𝑎𝑖 + 𝑏6

𝑎6𝑥+ 𝑏7 sin(𝑎7 𝑥) +𝑏8 cos(𝑎8𝑥) (3)

En donde los parámetros del modelo son:

𝑏0, 𝑏1 , 𝑏2 , 𝑏3, 𝑏4 … … 𝑏8, 𝑎1, 𝑎2, 𝑎3, 𝑎4 … … 𝑎8, 𝑐1, 𝑐2 y 𝑐3

El modelo establece la forma general de la ecuación de una regresión logística para prevenir los

distintos casos de comportamientos en los datos. En este trabajo l se realizó una adaptación del

modelo anterior para poder trabajar con problemas de una y varias variables, el procedimiento es

explicado a continuación.

En una serie de datos en donde se tiene que 𝑋0 , 𝑋1 ……… 𝑋𝑚 son variables independientes que

son cambiadas durante el experimento y Y es la variable dependiente medida para un experimento

se propone lo siguiente.

Para una variable 𝑋𝑖 que va desde 𝑋0 hasta 𝑋𝑚 se halla el valor 𝑓(𝑥) correspondiente a las

expresiones (2) y (3) y luego cada uno de los valores obtenidos para cada 𝑋𝑖 se suman para obtener

un �̅�𝑠𝑡 , es decir que se tendría la expresión (4).

𝐹𝑠𝑡 𝑖 = 𝑓(𝑋0) + 𝑓(𝑋1) … . . + 𝑓(𝑋𝑚) (4)

En donde el valor 𝐹𝑠𝑡 𝑖 es hallado hasta el número n de observaciones. Luego entonces se calcula

�̅�𝑠𝑡 y �̅� y con estos valores entonces se obtiene una constante de amplificación 𝐾. Este valor se

obtiene mediante la expresión (5).

𝐾 =�̅�

�̅�𝑠𝑡 (5)

Una vez encontrado 𝐾 se obtiene el valor estimado �̂� 𝑖 para cada variable dependiente 𝑌 𝑖 , el valor

estimado se calcula como se muestra a continuación en la expresión (6).

�̂� 𝑖 = 𝐾 𝐹𝑠𝑡 𝑖 (6)

8.3.1. Optimización del Modelo

Generalmente los modelos no lineales son más complejos debido a que en estos poseen un gran

número de parámetros, los cuales se deben hallar para encontrar el mejor ajuste a una serie de

datos, es por eso que se trata de simplificar en lo posible la optimización de estos valores. Para

obtener estos valores se suele recurrir a dos tipos métodos, el primero de estos es el desarrollo de

métodos exactos para encontrar los valores óptimos de los parámetros del modelo y los segundos

son procedimientos metaheurísticos para encontrar para encontrar los valores de los parámetros

que sean muy cercanos al optimo del modelo (Da Silva, 2008).El segundo método es el más

atractivo por que los procedimientos metaheurísticos no requieren de supuestos acerca de los

parámetros ( como es el caso de los métodos exactos) y ofrecen la posibilidad de obtener un óptimo

global de modelo expuesto en la expresiones (2) y (3), (Behnamian & Ghomi, 2009).Una vez

conocidas la ventajas de los procedimientos metaheurísticos ,se trabaja en base a estos y se utiliza

un nuevo algoritmo de búsqueda llamado cromático desarrollado por (Sabie, 2011) el cual ofrece

alternativas para encontrar muy buenos resultados en la búsqueda de los mejores parámetros para

el modelo de regresión no lineal.

8.3.2. Función objetivo

Existen muchos índices de eficiencia para encontrar el mejor ajuste a una curva o una serie de

datos, entre estos tenemos los indicadores de error como el ME, MAE, MSE y entre otros que son

los más conocidos en medidas de eficiencia en pronósticos. Sin embargo, estos suelen tener

algunas desventajas como la cancelación de errores de valores positivos con los de valores

negativos como es el caso del ME (Tsolacos, 2006), catalogar a errores más grandes con un peso

igual al de errores más pequeños como lo hace el MAE y el MSE (Rasmussen, 2004) y entre otros

aspectos más, lo que nos llevó a un indicador de error más robusto que nos permitiera obtener

resultados más precisos.

El indicador que se utilizo fue el 𝑅2 debido a que consultando en la literatura se encontró que este

índice de error ofrecía los mejores resultados para estos tipos de problemas. Este índice se expone

a continuación en la expresión (7).

𝑅2 = 1 − ∑ (𝑦𝑡−𝐹𝑡 )

2

𝑛𝑖=0

∑ (𝑦𝑡−�̅�𝑡 )2

𝑛𝑖=0

= 𝑆𝑆𝑅

𝑆𝑆𝑡𝑜𝑡𝑎𝑙 (7)

En donde 𝑦𝑡 es el valor observado y 𝐹𝑡 es el valor ajustado, 𝑆𝑆𝑡𝑜𝑡𝑎𝑙 es la varianza de los datos y

𝑅2 es el valor real de la variabilidad que puede tener el modelo. Este índice expresa la proporción

de varianza de la variable independiente explicada por la variable independiente (Eye & Schuster,

1998).

8.4. Codificación de Parámetros

Uno de los aspectos más importantes al trabajar con metaheurísticas, es decidir cómo se deben

representar las soluciones y que tan eficientes serian estas al realizar la búsqueda en el espacio de

soluciones. Lo que se trata de hacer por lo general son codificaciones sencillas y que reduzcan el

costo del algoritmo, debido a esto se decidió utilizar para la representación de todos los parámetros

𝑏0, 𝑏1 , 𝑏2 , 𝑏3, 𝑏4 … … 𝑏8, 𝑎1, 𝑎2, 𝑎3, 𝑎4 … … 𝑎8, 𝑐1, 𝑐2 y 𝑐3

En la codificación de las soluciones del problema para el algoritmo cromático, la propuesta hecha

por (Behnamian & Ghomi, 2009) cómo se muestra a continuación en la (ilustración Nº2).

Ilustración 2 Representación de una solución en el algoritmo Cromático.

8.5. Algoritmo Cromático

Este es un nuevo método de optimización combinatoria que se inspira y hace una relación con las

diferentes maneras con las que un músico u artista realiza y escoge la melodía más apropiada para

una pieza musical, a partir de la combinación de distintas notas musicales de la escala cromática.

La idea principal del método radica en que el músico elige o escoge la mejor melodía, la cual es la

que mejor se adapta y representa apropiadamente una tonada especifica.

Esta metaheurística se caracteriza por qué no necesita de un gran tamaño en el grupo de melodías

que se tienen como opción de búsqueda, es decir, que no necesita de un gran número de soluciones

iniciales para un obtener buenos resultados. El algoritmo trabaja con ML (melodía local) que es

la mejor solución de la iteración y con MM (melodía global) la cual es mejor la solución encontrada

hasta el momento, con estos realiza una búsqueda de vecinos a través de la escala cromática de

las notas musicales y realiza movimientos de búsqueda que se fundamentan en conceptos

musicales , además hace que la exploración del espacio de soluciones sea eficiente gracias a que

utiliza la combinación de poblaciones con diferentes características, logrando así diversificar el

conjunto de soluciones con el que se trabaja , es decir, que este algoritmo realiza arranques

múltiples en su búsqueda para poder salir de óptimos locales, lo cual es una gran ventaja en muchos

problemas de optimización donde existen gran cantidad de variables .

No obstante, se resalta que esta metaheurística ofrece una muy buena alternativa para la

recombinación y búsqueda de vecinos en problemas que son trabajados en codificación real (Sabie,

2011), lo que le da gran relevancia para obtener los mejores parámetros del modelo de las

expresiones (2) y (3) debido a que estos tipos de problemas necesitan de este tipo de codificación.

A continuación, se explican los principales operadores de búsqueda y los aspectos más importantes

del algoritmo cromático.

8.5.1. Vecinos de escala cromática

Para realizar la búsqueda de vecinos en números reales se adoptó la idea de la equivalencia de la

recta numérica con la escala cromática, por lo que se le asignó un intervalo de números reales a

cada nota musical en la recta numérica real, con una distancia de 0.5 entre un intervalo y otro,

tomando como referencia el medio tono de distancia que guarda cada nota en la escala cromática

musical. La equivalencia del número real con la nota musical de la escala se obtiene mediante las

expresiones (8), (9) y (10).

𝑣𝑎𝑙𝑜𝑟 𝑛𝑜𝑡𝑎 𝑚𝑢𝑠𝑖𝑐𝑎𝑙 = 𝛽 − 12𝛼 (8)

En donde β es igual al redondeo del número real δ a su entero siguiente y α es igual a redondeo

del número real Ω a su entero anterior.

Donde tenemos que:

𝛿 =𝑛𝑢𝑚𝑒𝑟𝑜 𝑟𝑒𝑎𝑙

0.5 (9)

𝛺 =𝛽

12 (10)

De igual manera el grado para cada nota es igual al termino α, dado el valor para el grado de cada

nota se calcula el intervalo de búsqueda de vecinos para la nota SI mediante la expresión (11) y

(12).

El límite inferior y superior del intervalo de la nota SI es:

𝐿 𝑖𝑛𝑓 = (𝛼)𝑥 6 − 0.5 (11)

𝐿 𝑠𝑢𝑝 = 𝐿 inf + 0.5 (12)

Entonces el intervalo para la búsqueda de vecinos para la nota SI es igual ((𝛼)𝑥 6 −

0.5, (𝛼)𝑥 6] .

Se aclara que este intervalo es abierto en el límite inferior y cerrado en el límite superior, no

obstante, a partir de este intervalo de la nota SI se hallan los de las demás notas siguientes, sumando

0.5 a ambos límites del para cada nota. Entonces una vez identificado el valor de nota musical para

cualquier número real, se obtiene su nota musical, luego con el grado específico de la nota se

calculan los límites de nota inferiores y superiores para el intervalo de nota correspondiente.

Con los intervalos obtenidos para cada nota se podrían generar buenos resultados, pero debido a

que estos son todavía muy grandes estos se dividen entre dos para realizar una búsqueda más

minuciosa. Esta búsqueda y división es explicada a continuación. Si se desea realizar una búsqueda

de vecinos en escala cromática del valor de la primera posición de la solución, se procede a

encontrar la nota y el intervalo, estos se obtienen con las expresiones correspondientes (8), (9) y

(10) junto con las expresiones (11) y (12).

De aquí se encuentra que el valor numérico que corresponde a la nota y su intervalo de búsqueda

de vecino. Este intervalo de divide en dos y se obtiene dos nuevos intervalos como se expone a

continuación.

El intervalo 1 → ( 𝐿 𝑖𝑛𝑓,𝐿 𝑠𝑢𝑝

2 ] y el intervalo 2 → (

𝐿 𝑠𝑢𝑝

2 , 𝐿 𝑠𝑢𝑝]

− Si el valor j de la posición de la mejor solución, a la que se le generara el vecino se

encuentra en el intervalo 1.

− Entonces se generan dos números aleatorios así:

s→ aleatorio entre 𝐿 𝑖𝑛𝑓 y el valor j (proveniente de una distribución uniforme)

p → aleatorio entre j y el valor 𝐿 𝑠𝑢𝑝

2 (proveniente de una distribución uniforme)

Una vez se obtienen los vecinos s y p se evalúa la solución con cada uno de ellos y se escoge la

de mejor valor.

− Si en el caso contrario valor j de la posición de la mejor solución, a la que se le generara el

vecino se encuentra en el intervalo 2. Entonces se generan dos números aleatorios así:

s→ aleatorio entre 𝐿 𝑠𝑢𝑝

2 y el valor j (proveniente de una distribución uniforme)

p → aleatorio entre j y el valor del 𝐿 𝑠𝑢𝑝 (proveniente de una distribución uniforme)

Una vez se obtienen los vecinos s y p se evalúa la solución con cada uno de ellos y se escoge la

de mejor valor.

8.5.2. Vecinos de Inspiración y de Rotación

− VECINOS DE INSPIRACIÓN: Este tipo de variación resulta de un cambio pensamiento y

sentido en la posición de una nota específica la cual es cambiada de forma imprevista y que

busca mejorar la melodía que se tiene actualmente. Este tipo de vecinos se obtienen generando

un numero aleatorio j entre del número máximo de notas k de la melodía. El número j obtenido

representa la nota y es la posición de la variable que se modificara a través de la inspiración,

luego entonces lo que se hace es cambiar la nota escogida por un numero aleatorio i del espacio

de soluciones del problema y proveniente de una distribución uniforme.

− VECINOS DE ROTACIÓN DESCENDENTES: En los vecinos de rotación descendentes las

variables de cada solución son consideradas notas a las cuales se les modificaran sus

posiciones. Se obtiene la octava de la nota correspondiente. Esta se genera con un número

aleatorio j entre 8 y las k variables del problema.

8va→ un número aleatorio j entre 8 y las k notas de la melodía conveniente actual

• Se obtiene la quinta de la nota correspondiente. Esta encuentra al restarle 3 posiciones

a la 8va

5ta → se obtiene de → 8va – 3

• Se obtiene la cuarta de la nota correspondiente. Esta encuentra al restarle 4 posiciones

a la 8va

4ta → se obtiene de → 8va – 4

• Se obtiene la primera de la nota correspondiente. Esta encuentra al restarle 7

posiciones a la 8va

1ra → se obtiene de → 8va – 7

Los movimientos para la generación de vecinos de rotación descendentes son expuestos a

continuación en la (ilustración Nº3). Cada nota gira hacia delante tomando la posición clave más

cercana.

Ilustración 3 Vecinos de Rotación descendentes

− VECINOS DE ROTACIÓN ASCENDENTES: En los vecinos de rotación ascendentes las

variables de cada solución son consideradas notas a las cuales se les modificaran sus

posiciones. Se obtiene la primera de la nota correspondiente. Esta se genera con un número

aleatorio j entre 1 y las (k- 8) variables del problema.

1ra → un número aleatorio j entre 1 y las k- 8 posiciones de la melodía conveniente actual

• Se obtiene la cuarta de la nota correspondiente. Esta encuentra al sumarle 3 posiciones

a la 1ra

4ta → se obtiene de → 1ra + 3

• Se obtiene la quinta de la nota correspondiente. Esta encuentra al sumarle 4 posiciones

a la 1ra

5ta → se obtiene de → 1ra + 4

• Se obtiene la octava de la nota correspondiente. Esta encuentra al sumarle 7 posiciones

a la 1ra

8va → se obtiene de → 1ra +7

Los movimientos para la generación de vecinos de rotación ascendentes son expuestos a

continuación en la (ilustración Nº4). Cada nota gira hacia atrás tomando la posición clave más

cercana.

Ilustración 4 Vecinos de Rotación ascendentes.

8.6. Parámetros y Pseudocódigo del Algoritmo Cromático

8.6.1. Parámetros Evaluación De Ejercicios Alta Complejidad

Para esta primera parte se trabajó con un tamaño 10 en el grupo de melodías iniciales por ARRAM,

este parámetro ARRAM fue 100 iteraciones y el criterio máximo de parada fue de 1000 iteraciones.

El valor para AM fue de 0.0971352, MC, VMC y UM fueron de 0.552618 0.233438 y 0.483767

respectivamente (Sabie, 2011). Para todos los parámetros:

𝑏0, 𝑏1 , 𝑏2 , 𝑏3, 𝑏4 … … 𝑏8, 𝑎1, 𝑎2, 𝑎3, 𝑎4 … … 𝑎8, 𝑐1, 𝑐2 y 𝑐3 Se realizaron sus estimaciones en un

rango límite de [-1,1]. Para los parámetros 𝑏0, 𝑐1, 𝑐2 se realizaron estimaciones iniciales de 1, 1

y 0 respectivamente para prevenir indeterminaciones dentro del modelo.

8.6.2. Parámetros Evaluación Caso de Estudio Practico

En esta oportunidad se realizaron corridas con un tamaño 10 en el grupo de melodías iniciales por

ARRAM, este parámetro ARRAM fue 30 iteraciones y el criterio máximo de parada fue de 8

horas. El valor para AM fue de 0.0971352, MC, VMC y UM fueron de 0.552618 0.233438 y

0.483767 respectivamente (Sabie, 2011). Para todos los parámetros:

𝑏0, 𝑏1 , 𝑏2 , 𝑏3, 𝑏4 … … 𝑏8, 𝑎1, 𝑎2, 𝑎3, 𝑎4 … … 𝑎8, 𝑐1, 𝑐2 y 𝑐3 Se realizaron sus estimaciones en un

rango límite de [-1,1]. Igualmente, para los parámetros 𝑏0, 𝑐1, 𝑐2 se realizaron estimaciones

iniciales de 1, 1 y 0 respectivamente para prevenir indeterminaciones dentro del modelo.

9. RESULTADOS Y DISCUSIONES

En esta sección inicialmente se compara el algoritmo propuesto con varios modelos de tipo lineal

y no lineal, en unos cuatro problemas que pertenecen al grupo de modelos ‘‘test problems” los

cuales son considerados por el National Institute Standards and Technology USA website, como

modelos con un alto nivel de dificultad.

Posteriormente son mostrados los resultados del algoritmo en unos problemas multivariables en

caso de estudio práctico. Estos mismos se desprenden de la valoración y análisis de la estimación

de precios para tipos de ganado seleccionados según datos históricos que se asocian con variables

de tipo ganado, referenciado como lo son; cantidad, mes y precios de venta. Cabe resaltar que estos

se obtienen sobre hechos de venta e históricos. Los mismos datos fueron obtenidos a través de

información generada por la empresa Subastar S.A. de la ciudad de Montería- Córdoba.

En específico se implementó el algoritmo de búsqueda y el modelo no lineal de series de tiempo

para realizar los ejercicios de pronóstico en tipos específicos de ganado, conforme a los datos

recolectados.

9.1. Problemas de Evaluación: Ejercicios de Alta Complejidad

9.1.1. Problema de evaluación N°1 (Clase polinomial)

Este problema de evaluación tiene 82 datos y es conocido como ‘‘Fillip” y consta de 11

parámetros, el modelo es expuesto en la expresión (13).

𝑦 = 𝛽0 + 𝛽1𝑥 + 𝛽2𝑥2 + … + 𝛽9𝑥9 +𝛽10𝑥10 + ℰ (13).

Los resultados del modelo propuesto son expuestos en el (Gráfico Nº1) y en la (Tabla Nº1) se

presenta la comparación de resultados de la solución estándar y del modelo propuesto.

9.1.2. Problema de evaluación N°2 Clase (polinomial)

Este problema de evaluación tiene 21 datos, es conocido como ‘‘Wampler4” y consta de 6

parámetros, el modelo es expuesto en la expresión (14).

𝑦 = 𝛽0 + 𝛽1𝑥 + 𝛽2 𝑥2 + 𝛽3 𝑥

3 + 𝛽4 𝑥4 + 𝛽5 𝑥

5 + ℰ (14).

Los resultados del modelo propuesto son expuestos en el (Gráfico Nº2) y en la (Tabla Nº2) se

presenta la comparación de resultados de la solución estándar y del modelo propuesto.

9.1.3. Problema de evaluación N°3 (Clase racional)

Este problema de evaluación tiene 11 datos, es conocido como ‘‘MGH09”, y consta de 4

parámetros, el modelo es expuesto en la expresión (15).

𝑦 =𝛽1 (𝑥2+ 𝑥𝛽2)

𝑥2+𝑥𝛽3 + 𝛽4 (15).

Los resultados del modelo propuesto son expuestos en el (Gráfico Nº3) y en la (Tabla Nº3) se

presenta la comparación de resultados de la solución estándar y del modelo propuesto.

9.1.4. Problema de evaluación N°4 (Clase diversa)

Este problema de evaluación tiene 154 datos, es conocido como ‘‘Bennett5”, y consta de 4

parámetros, el modelo es expuesto en la expresión (16).

𝑦 = 𝛽1 (𝑥 + 𝛽2)−1

𝛽3⁄

+ ℰ (16).

Los resultados del modelo propuesto son expuestos en el (Gráfico Nº4) y en la (Tabla Nº4) se

presenta la comparación de resultados de la solución estándar y del modelo propuesto.

Tabla 1 Comparación de resultados problema N°1.

MÉTODO R- CUADRADO PREDICCIÓN DE

ERROR

SOLUCIÓN ESTÁNDAR 0.996 0.004

MODELO PROPUESTO 0.995 0.005

Gráfico 1 Ajuste para el problema N°1

.

Tabla 2 Comparación de resultados problema N°2.

MÉTODO R- CUADRADO PREDICCIÓN DE ERROR

SOLUCIÓN ESTÁNDAR 0.9574 0.0426

MODELO PROPUESTO 0.9982 0.0018

Gráfico 2 Ajuste para el problema N°2.

Tabla 3 Comparación de resultados problema N°3.

MÉTODO R- CUADRADO PREDICCIÓN DE

ERROR

SOLUCIÓN ESTÁNDAR 0.9915 0.0025

MODELO PROPUESTO 0.9996 0.0004

Figura Nº6. Ajuste para el problema N°3.

Gráfico 3 Ajuste para el problema N°3.

Tabla 4 Comparación de resultados problema N°4.

MÉTODO R- CUADRADO PREDICCIÓN DE

ERROR

SOLUCIÓN ESTÁNDAR 0.99998 0.00001

MODELO PROPUESTO 0.99998 0.00001

Figura Nº7. Ajuste para el problema

Gráfico 4 Ajuste para el problema N°4.

9.2. Problemas con Múltiples Variables

9.2.1. Caso Precios del Ganado Tipo Hembra de Vientre 2 ¾ (HV) en Córdoba

Este ejercicio de evaluación de se procede a realizar la estimación de precios para ganado tipo

hembra de vientre, edad de 2 ¾ años, HV, a partir de las variables tiempo, cantidad, de la siguiente

manera; mes del año, cantidad promedio mensual, para estimar el valor del precio promedio de

venta del mes por kilogramo.

Importante señalar que la estimación se lleva a cabo con fundamento en los datos históricos

recopilados para los años 2014-2019. La fuente directa de información se concreta gracias al

contenido público disponible en la web oficial la empresa Subastar S.A. de la ciudad de Montería-

Córdoba.

Los datos y resultados del modelo propuesto para la estimación de precios ganado tipo HV son

expuestos en las (Tablas Nº5 y Nº6) y en el (Gráfico Nº5).

9.2.2. Caso Precios del Ganado Tipo Vaca Escotera 3 (VE) en Córdoba

En este punto se estiman los precios para ganado tipo vaca escotera con 3 años de edad, VE, a

partir de las variables tiempo, cantidad, de la siguiente manera; mes del año, cantidad promedio

mensual, para estimar el valor del precio promedio de venta del mes por kilogramo.

La estimación se lleva a cabo con fundamento en los datos históricos recopilados para los años

2014-2019. La fuente directa de información se concreta gracias al contenido público disponible

en la web oficial la empresa Subastar S.A. de la ciudad de Montería- Córdoba.

Los datos y resultados del modelo propuesto para la estimación de precios ganado tipo VE son

en las (Tablas Nº7 y Nº8) y en el (Gráfico Nº6).

9.2.3. Caso Precios del Ganado Tipo Toro 3 (TO) en Córdoba

En el caso de esta aplicación se estiman los precios para ganado tipo toro de 3 años, TO, a partir

de las variables tiempo, cantidad, de la siguiente manera; mes del año, cantidad promedio mensual,

para estimar el valor del precio promedio de venta del mes por kilogramo.

La estimación se lleva a cabo con fundamento en los datos históricos recopilados para los años

2014-2019. La fuente directa de información se concreta gracias al contenido público disponible

en la web oficial la empresa Subastar S.A. de la ciudad de Montería- Córdoba.

Los datos y resultados del modelo propuesto para la estimación de precios ganado tipo TO son

en las (Tablas Nº9 y Nº10) y en el (Gráfico Nº7).

Tabla 5 Datos y resultados ganado tipo HV.

Tiempo (meses) Cantidad Promedio Precio Promedio Real (pesos) Precio Promedio Estimado (pesos)

1 12.8 2726 2727.194077

2 16 2697 2623.849992

3 16.5 2765 2682.486227

4 9.333 2976 2722.878998

5 2.75 3025 2680.572582

6 22.25 2884 2887.752678

7 7 2724 2734.386029

8 9 2634 2738.651339

9 11.333 2828 2716.426216

10 16.6 2682 2646.419485

11 6.333 2725 2501.050117

12 13.5 2670 2567.604289

13 14.25 2696 2615.985785

14 10.833 2735 2749.573671

15 16 2817 2865.210041

16 15.166 3008 2964.015016

17 1 2880 2947.110738

18 8.111 3008 3032.680053

19 5 2878 3067.035414

20 13.125 2908 3078.98837

21 18.75 2934 3064.215444

22 15.833 3004 2993.227752

23 20 2975 2993.530813

24 31 3020 3057.413933

25 13.833 3276 3048.577761

26 20.333 2887 3202.78058

27 13 3320 3299.977595

28 7.5 3350 3326.704124

29 17 3920 3542.7033

30 4.571 3908 3515.441524

31 12.2 3725 3586.950341

32 8.833 3586 3505.342045

33 13.5 3574 3493.425366

34 15.75 3531 3470.94247

35 6.25 3462 3374.967348

36 9 3512 3436.273602

37 14.5 3527 3518.078964

38 14.666 3647 3613.663007

39 10.5 3681 3747.74845

40 4 3723 3767.529279

41 14.4 3762 3880.266208

42 6.714 3749 3838.222151

43 2.5 3525 3765.865538

44 3.2 3628 3765.447772

45 9.333 3642 3783.30568

46 14.5 3713 3726.833668

47 13.142 3734 3702.00439

48 4.5 3620 3655.132694

49 13 3730 3741.966976

50 20.5 3879 3838.740651

51 12 3902 3901.847523

52 8.5 3810 3893.338354

53 9.4 3962 3975.353587

54 9.4 3859 3976.30845

55 15.5 3731 3955.968485

56 14.75 3619 3871.983157

57 13.833 3814 3786.229807

58 8.666 3615 3672.429824

59 8.6 3592 3617.307285

60 42 3780 3739.306473

61 7.25 3392 3591.155406

62 1.666 3613 3581.609042

63 4.333 3856 3760.688165

64 4.333 4110 3820.942681

65 11.6 3889 3926.715932

66 8 3903 3822.172976

67 10.066 3660 3869.09646

68 15.333 3648 3792.84739

69 11 3658 3735.040784

70 25.833 3606 3690.367422

71 15 3568 3599.579949

72 18.5 3637 3646.560309

Tabla 6 Comparación de resultados ganado tipo HV.

MÉTODO R- CUADRADO PREDICCIÓN DE ERROR

MODELO PROPUESTO 0.913229116930542 0.0867708830694582

Gráfico 5 Ajuste para el caso tipo HV

Tabla 7 Datos y resultados ganado tipo VE

Tiempo (Meses) Cantidad Promedio Precio Promedio Real (pesos) Precio Promedio Estimado (pesos)

1 48 2665 2635.948822

2 39.85 2609 2626.949422

3 27 2766 2735.810601

4 20.42 2972 2856.773269

5 18.44 2961 2914.947944

6 29.28 2748 2805.197465

7 40 2682 2711.104518

8 34.5 2499 2645.739042

9 57.33 2554 2506.882372

10 58.44 2542 2408.554837

11 62.5 2570 2343.442693

12 68.16 2563 2333.273438

13 71 2554 2383.392814

14 51.125 2606 2484.647471

15 48.222 2730 2605.414679

16 25.444 2812 2806.903656

17 16 2905 2996.92874

18 35.25 2861 2876.528747

19 43 2680 2860.72841

20 35.125 2760 2855.573692

21 30.375 2799 2839.513827

22 34.2 2782 2785.194189

23 55.666 2803 2745.442525

24 41.2 2966 2798.918724

25 40.625 2975 2882.539152

26 46.333 2792 2985.086313

27 28.222 2969 3170.607817

28 22.428 3371 3329.602922

29 17.571 3887 3466.567284

30 26.5 3756 3413.29678

31 27 3408 3417.528277

32 25.75 3343 3408.467434

33 31.625 3327 3335.950001

34 26.875 3301 3340.492852

35 22.75 3357 3372.823099

36 32.285 3380 3324.269852

37 47.166 3380 3338.799216

38 18.75 3399 3575.63406

39 24.222 3500 3591.554816

40 10.285 3649 3815.945202

41 27 3707 3674.475428

42 30.22 3594 3661.924291

43 44 3372 3591.583888

44 40.2 3538 3554.000513

45 31.875 3567 3530.517106

46 21.555 3556 3565.07978

47 23.333 3469 3515.14756

48 26 3378 3489.405673

49 19.42 3599 3588.176893

50 26.85 3605 3558.371729

51 19.57 3624 3685.758795

52 25.14 3789 3665.180415

53 21.22 3750 3724.592906

54 24.62 3767 3677.263234

55 26.11 3586 3625.882643

56 27.62 3515 3556.118702

57 36.28 3545 3443.522414

58 21 3362 3501.401601

59 24 3300 3439.376462

60 31 3418 3391.275918

61 25.66 3350 3465.60834

62 13.42 3441 3653.591383

63 28 3634 3566.750127

64 21.37 3791 3680.020057

65 14.57 3942 3785.177881

66 17.5 3808 3757.956168

67 21.87 3691 3683.998413

68 28.77 3428 3585.2216

69 39.37 3385 3497.219223

70 30.5 3404 3511.118326

71 43.85 3355 3466.364991

72 34.33 3499 3526.940565

Tabla 8 Comparación de resultados ganado tipo VE.

MÉTODO R- CUADRADO PREDICCIÓN DE ERROR

MODELO PROPUESTO 0.92336262 0.07663738

Gráfico 6 Ajuste para el caso tipo VE.

Tabla 9 Datos y resultados ganado tipo TO.

Tiempo (Meses) Cantidad Promedio Precio Promedio Real (pesos) Precio Promedio Estimado (pesos)

1 5.4 2965.2 2840.608083

2 6.428571429 2949 2936.945064

3 2.333333333 3060.333333 3029.201733

4 3.333333333 3170 2983.303759

5 2.2 3256.8 3012.636364

6 3 3016 2876.932097

7 3.888888889 2878.666667 2740.222271

8 3.222222222 2844.555556 2677.720147

9 2.4 2862.2 2688.90682

10 17.33333333 2875.555556 2693.773357

11 6 2890.25 2769.065391

12 4.2 2919.6 2868.96943

13 7.375 2918 3114.848659

14 14 3048.714286 3088.158765

15 5.111111111 3056.25 3219.185255

16 5.857142857 3146.857143 3278.668019

17 4.285714286 3144.571429 3238.342269

18 7.222222222 3338.888889 3288.898306

19 6.625 3103.25 3193.217727

20 6.428571429 3189.714286 3124.356501

21 5.857142857 3234 3073.234311

22 14.55555556 3186.333333 3046.011816

23 7.125 3268.25 3256.265963

24 4.4 3271.2 3294.327097

25 12 3416.571429 3420.138615

26 4.6 3235 3579.883443

27 4 3422.428571 3696.650512

28 3.6 3598.6 3784.770832

29 3.666666667 4129.666667 3824.13027

30 5.25 4166.5 3830.951025

31 9.75 4056.125 3914.77932

32 8.428571429 4036 3925.949287

33 2.833333333 3839.5 3832.812218

34 4.2 3937.4 3791.865827

35 5.833333333 3896 3858.163768

36 2.666666667 4015.166667 3955.521638

37 9.5 4005.666667 4086.738703

38 2.2 3975.2 4146.742319

39 3.333333333 3969 4144.202765

40 2.8 4316.4 4218.608984

41 3.333333333 4173 4210.592109

42 2.5 4056.125 4252.925909

43 8.2 3984 4282.038071

44 6.142857143 4164.428571 4150.308148

45 3.142857143 4074.714286 4093.94908

46 3.142857143 4096.857143 4054.228539

47 8.571428571 4138.285714 4133.891247

48 7 4166.75 4091.897617

49 2.6 4242 4101.107352

50 6.428571429 4185.714286 4134.157476

51 6.5 4169.833333 4182.05395

52 6.428571429 4277 4212.632615

53 8.833333333 4408.5 4304.404503

54 14.85714286 4302.571429 4148.630162

55 7 4170.714286 4225.519204

56 4 4060.625 4099.78106

57 6 4062.5 4081.823574

58 19.33333333 3910.833333 3985.403793

59 8 3946.6 4105.044011

60 13 4027.833333 3935.236023

61 17.33333333 3911.5 4075.658057

62 5.75 3900.5 4103.64338

63 10 4181 4236.24999

64 3 4460 4251.334909

65 6 4478.166667 4295.21247

66 5.833333333 4327.333333 4318.754164

67 12 4182.333333 4278.376266

68 7.571428571 4091.571429 4407.15411

69 19 4103 4279.504995

70 15.88888889 4058 4284.599186

71 17 3994 4305.077418

72 29.33333333 4147 4095.807837

Tabla 10 Comparación de resultados ganado tipo TO.

MÉTODO R- CUADRADO PREDICCIÓN DE ERROR

MODELO PROPUESTO 0.92690734 0.07309266

Gráfico 7 Ajuste para el caso tipo TO.

10. CONCLUSIONES

En este proyecto se trabajó con un modelo de regresión no lineal en pronóstico de series de

tiempo con diferentes problemas de gran dificultad. Se encontró que el algoritmo cromático

ofrece muy buenos resultados en la búsqueda, de conformidad con los parámetros para el

modelo.

De los ejercicios desarrollados, se destaca a este algoritmo debido a que ofrece grandes

ventajas en la exploración y la diversificación de las soluciones, lo que es muy importante a

la hora de encontrar óptimos globales en un espacio de soluciones. Los resultados obtenidos

para los problemas de alta dificultad muestran que se supera en la mayoría de los casos las

soluciones estándares encontradas en la literatura.

Para los ejercicios relacionados con los casos prácticos se identificó que el modelo arroja

buenos resultados para la estimación de valores a partir de múltiples variables, que a su vez

permiten en gran manera efectuar pronósticos para diferentes escenarios en los problemas

de series de tiempo estudiados. Debe indicarse que del análisis de los datos estudiados para

los años 2014-2019, se observa una tendencia estacionaria de precios relacionada con las

características climáticas de la región.

Es notorio que las estimaciones realizadas por el modelo son próximas y ajustadas con la

relación de datos históricos sobre los meses del año y los precios de venta del ganado según

su tipo en la región analizada.

En esta propuesta se evidencia la eficiencia y robustez del modelo propuesto para encontrar

muy buenos ajustes en diferentes series de datos, tanto de una, como de múltiples variables.

El modelo se adecuo satisfactoriamente y tuvo un alto poder predictivo en comportamientos

lineales, no lineales, cíclicos y estacionales.

Además, hay que resaltar que en el algoritmo también logra que este sea capaz de hacer que

sus soluciones cumplan con los supuestos o restricciones que son por lo general necesarias

para hacer uso de los modelos de regresión, lo que ratifica a un mas esta nueva propuesta y

la hace más sólida y confiable.

11. RECOMENDACIONES

En definitiva, después del desarrollo y análisis de los resultados de la investigación, podemos

afirmar que el Algoritmo Cromático ofrece soluciones que se ajustan de manera adecuada

atendiendo las restricciones y la optimización de recursos en la búsqueda.

Se recomienda complementar el desarrollo de esta investigación, aprovechando el

desempeño que evidencia el Algoritmo Cromático y el modelo implementado en más casos

reales, debido a que este promete alcanzar muy buenos resultados con respecto a la calidad

de sus soluciones. Igualmente se sugiere abarcar otras consideraciones para otros tipos de

problemas a fin de conocer más a fondo el desempeño del algoritmo.

Adicionalmente se sugiere que, para realizar ejercicios de búsqueda con el modelo

propuesto, en problemas de pronósticos, se realicen diferentes arranques e iteraciones de

revisión con el fin de estimar mejores resultados y poder comparar los valores obtenidos y

los indicadores de minimización del error.

12. BIBLIOGRAFÍA

A.J. Nebro, J. D.-N. (2009). smpso: a new pso-basedmethaeuristicformulti-objetive optimization. Obtenido

de www.IEEEpress

Alsmadi, M. K., Omar, K. B., Noah, & A., S. (2009). Back Propagation Algorithm: The Best Algorithm

Among the Multi-layer Perceptron Algorithm. International Journal of Computer Science and

Network Security.

Barreras Serrano, A., Eduardo, S. L., & Figueroa Saavedra, F. (2014). Uso de un modelo univariado de

series de tiempo para la predicción, en el corto plazo, del comportamiento de la producción de carne

de bovino en Baja California, México. *Instituto de Investigaciones en Ciencias Veterinarias de la

Universidad Autónoma de Baja California.

Behnamian, J., & Ghomi, F. (2009). Development of a PSO–SA hybrid metaheuristic for a new

comprehensive. Elsevier.

Botero, S., & Cano, J. (2008). Análisis de series de tiempo para la predicción de los precios de la energía

en la bolsa de Colombia. CUADERNOS DE ECONOMÍA 48, 2008 .

Box, G. E., Jenkins, G. M., & Reinsel, G. C. ( 2015.). Time Series Analysis: Forecasting and. Wiley.

Brockwell, P. J., & Davis, R. A. (2010). Introduction to Time Series and Foirecasting. Springer .

Burke, E., Cowling, P., & Landa silva, J. (2006). Hybrid Population-Based Metaheuristica Approachsfor.

the space a llocation problem. Obtenido de www.ieeepress.

Castillo, O. (2007). Comportamiento temporal de los precios del ganado macho de levante de primera en

Sincelejo. Temas Agrarios Universidad de Córdoba, Departamento de Ingeriría Agronómica y

Desarrollo Rural. .

Castillo, O. (2007). Estacionalidad, ciclos y volatilidad en los precios del ganado macho de levante en

Montería, Colombia. Rev MVZ, Cordoba.

Castro, P., & V, F. (2008). Mobais: A Bayesian Artificial Immune System For Muti-Objectives

Optimization. 7 th international conference. phuket thailand.

Chatfield, C. (2004). The Analysis of Time Series: An Introduction. MA: Chapman & Hall .

Cortes, P., Garcia, J. M., Muñusuri, J., & Onieva, L. (2008). Viral System: A New Bio-Inspired

Optimization Aproach. Computers y Operation Reseach 35, 2841.

De Gooijer, J. G., & Hyndman, R. J. (2006). 25 years of time series forecasting. Elsevier.

Espinosa, J., Vélez, & A. (2017). Descripción y pronóstico de la producción de carne de bovino en el estado

de Tabasco. Actas Iberoamericanas en Conservación Animal .

Eye, A. V., & Schuster, C. (1998). Regression analysis for social sciences (1st ed.). . San Diego: Academic

Press.

Hastie, T., Tibshirani, R., & Friedman, J. (Springer). The elements of statistical learning: data mining,

inference and prediction. 2009.

INACAP. (2003). Manual de Analisis y Diseño de Algoritmos. 18. Obtenido de

www.innformatica.INACAP.cl

Kang Seok, L., & Zong woo, G. (2004). A New Structural Optimization Method Basedon The Harminy

Search Algorithm. Obtenido de www.sciencedirect press.

Kantz, H., & Schreiber, T. (2009 ). Nonlinear Time Series Analysis. Springer Series in Statistics.

Leung, S. C., & DefuZhang, C. T. (2010). A Hybrid simulater annealing methaeuristic. Obtenido de

www.algorithmforthetwo-dimencionalknapsackpackingproblemsciencedirectpress

Lopez, S. (2019). Determinantes del precio del ganado gordo bovino en pie de Medellín y Bogotá: 2009-

2019. Medellin, Colombia: Escuela De Economía Y Finanzas - Universidad EAFIT.

Melian, B., J.A.Moreno, & Moreno, J. (2003). Methaeuristicas: A Global View. Universidad De La

Laguna.

Montgomery, D. C. (2004). Desing and analysis of experiments book. 458-459.

Nader, A., & Zolfaghari, S. L. (2007). A New Meta-Heuristic Approach For Cominatorial Optimization

And Scheduling Problems. 7-14. Obtenido de www.ieeepress.

ob . (s.f.). 25, 26.

Rasmussen, R. (2004). On time-series data and optimal parameters. . Omega, 32,111–120.

RÌos, G. (2008). Series de Tiempo. Santiago: Departamento de Ciencias de la Computación - Universidad

de Chile.

Rodríguez Rivero, C. (2016). Modelos no lineales de pronóstico de series temporales basados en

inteligencia computacional para soporte en la toma de decisiones agrícolas. Córdoba, Argentina:

Facultad de Ciencias Exactas, Físicas y Naturales - UNIVERSIDAD NACIONAL DE CÓRDOBA

.

Ruiz, U. V. (2003). Manual de Analisis y Diseño de Algoritmos. INACAP.

Sabie, R. (2011). Un nuevo método de optimización que se fundamenta a través de un algoritmo de

búsqueda basado en la escala cromática de las notas musicales. Montería, Cordoba, Colombia:

Universidad de Córdoba.

Sebastian Urrutia, I. l. (2005). a new metheuristic and its application to the steiner problem in graphs.

universidad de buenos aires.

Shumway, R. H., & Stoffer. (2011). Time Series Analysis and its Applications. Springer.

Silver, E. (2004). An Overview Of Heuristic Solution Methods. The Journal Of The Operational Research

Society, 55(9), 936- 956.

Tong, H. (1990). Non-linear Time Series: A Dynamical System Approach. Oxford: Oxford University

Press.

Tsolacos, S. (2006). An assessment of property performance forecasts, consensus versus econometric. .

Journal of Property Investment & Finance, 24,386–399.

Weigend, A. S., Huberman, B. A., & Rumelhart, D. E. (1990). Predicting the future: a connectionist

approach. International Journal of Neural Systems, 193-209.

Werbos, P. (1974). Beyond Regression: New Tools for Prediction and Analysis in the Behavioral Sciences.

Cambridge: PhD thesis, Harvard University, Cambridge, MA (1974).

Yu, X., Efe, M. O., & Kaynak, O. (s.f.). A General Backpropagation Algorithm for Feedforward Neural

Networks Learning. IEEE, 2002.

Zhang, G. (2003). Time series forecasting using a hybrid ARIMA and neural network model. Elsevier.

Zhang, G. P., & M., K. D. (2007). Quarterly Time-Series Forecasting With Neural Networks. EEE

TRANSACTIONS ON NEURAL NETWORKS.

ANEXOS Y DIAGRAMAS APLICATIVO

Pseudocódigo del algoritmo.

INICIALIZAR LOS PARÁMETROS INCLUYENDO, TAMAÑO(N) DE GRUPO DE MELODÍAS INICIALES(GMI)

POR ARRAM ,MÁXIMO DE ITERACIONES POR ARRAM, AM, UM, MC Y VMC

MIENTRAS QUE NO SE ALCANCE LA CONDICIÓN DE PARADA

MIENTRAS QUE NO SE ALCANCE EL MÁXIMO DE ITERACIONES POR ARRAM

GENERAR GRUPO DE MELODÍAS INÍCIALES (GMI) DE TAMAÑO(N)

PARA i = 1 HASTA EL TAMAÑO (N) DEL GRUPO DE MELODÍAS(GMI)

EVALUAR CADA Xi MELODÍA DEL GRUPO

SI FITNESS DE (Xi) ES MEJOR QUE EL FITNESS (ML)

ML ← Xi ; FITNESS (ML) ← FITNESS (Xi)

FIN SI

SI FITNESS DE (ML) ES MEJOR QUE EL FITNESS (MM)

MM← ML; FITNESS (MM) ← FITNESS (ML)

FIN SI

FIN PARA

PARA i = 1 HASTA EL TAMAÑO (N) DEL GRUPO DE MELODÍAS

SI LA PROBABILIDAD AM ES MAYOR QUE UN NUMERO ALEATORIO

ENTRE CERO Y UNO PARA LA Xi MELODÍA

PARA j = 1 HASTA EL NUMERO K DE VARIABLES DE LA MELODÍA Xi

SI LA PROBABILIDAD UM ES MAYOR QUE UN NUMERO ALEATORIO

ENTRE CERO Y UNO

REMPLAZAR EL VALOR DE LA VARIABLE j DE LA melodía Xi

POR EL VALOR DE LA VARIABLE j DE LA MM

SI NO

REALIZAR UNA BÚSQUEDA DE VECINOS DE ESCALA CROMÁTICA

PARA EL VALOR DE LA VARIABLE j DE LA MELODÍA Xi

FIN SI

FIN PARA

SI NO

SI LA PROBABILIDAD MC ES MAYOR QUE UN NUMERO ALEATORIO

ENTRE CERO Y UNO PARA LA Xi MELODÍA

SE REMPLAZA LA Xi MELODÍA POR LA ML

SI NO

ESCOGER DOS MELODÍAS ALEATORIAS (S, P) DEL GRUPO DE MELODÍAS

ASIGNAR EL VALOR UNO A LA MELODÍA (S) Y DOS A LA MELODÍA (P)

PARA j = 1 HASTA EL NUMERO K DE VARIABLES DE LA MELODÍA Xi

GENERAR UN NÚMERO ALEATORIO ENTRE UNO Y DOS

SI NUMERO ALEATORIO ES IGUAL A UNO

REMPLAZAR EL VALOR DE LA VARIABLE j DE LA MELODÍA Xi

POR EL VALOR DE LA VARIABLE j DE LA MELODÍA S

SI NO

REMPLAZAR EL VALOR DE LA VARIABLE j DE LA MELODÍA Xi

POR EL VALOR DE LA VARIABLE j DE LA MELODÍA P

FIN SI

FIN PARA

FIN SI

SI LA PROBABILIDAD VMC ES MAYOR QUE UN NUMERO ALEATORIO

ENTRE CERO Y UNO PARA LA Xi MELODÍA

SE REALIZA UNA BÚSQUEDA DE VENOS DE INSPIRACIÓN

SI NO

SE REALIZA UNA BÚSQUEDA DE VENOS DE ROTACIÓN DE NOTAS

FIN SI

FIN SI

FIN PARA

FIN PARA

FIN PARA

FIN

Diagrama de bloques algoritmo.

SI

NO

SI

NO

NO

SI

NO

SI

NO

SI

SI SI NO

¿NO SE CUMPLE EL CRITERIO DE PARADA?

INICIO

2

INICIALIZAR PARÁMETROS

EVALUAR LA FUNCIÓN OBJETIVO Y

ACTUALIZAR (MM) Y (ML)

SI NO SE CUMPLE AM

¿SE CUMPLE EL # DE ITERACIONES ARRAM?

SI SE CUMPLE UM

ACTUALIZAR (MM)

SE REALIZA UNA BÚSQUEDA DE

VECINOS CROMÁTICA

EVALUAR F.O

SE UTILIZA UM

GENERAR GRUPO DE MELODÍAS (G M I)

FIN

¿SE CUMPLE LA

MC?

REALIZAR MC

SE COMBINAN 2 MELODÍAS ALEATORIAS

¿SE CUMPLE LA MC?

REALIZAR VECINOS

DE INSPIRACIÓN

REALIZAR VECINOS DE

ROTACIÓN DE NOTAS

2

2

ANEXO: DIAGRAMAS Y CASOS DE APLICACIÓN

− Diseño del Sistema

En este sección se hace hincapié a lo referente a la funcionalidad del sistema, como también a la

descripción de las acciones asociadas al uso de la aplicación, a través de los casos de uso ,

diagramas de actividades y de secuencias.

− Diagramas de casos de usos

o Caso de uso general del sistema

A continuación, se muestra todas las posibles acciones que se presentarán en el sistema.

Caso de uso general del sistema

− Documentación caso de uso Cargar Datos Históricos

Código C2-02

Nombre Cargar Muestra de Datos

Actores Invitado

Descripción Permite subir los datos que serán la muestra

a predecir

Precondición El archivo a cargar debe ser de tipo excel

Flujo de eventos 1. El invitado se dirige a la seccion

cargar muestra de datos

2. Selecciona el archivo a cargar

3. El sistema le muestra los datos

cargados

Poscondición

Excepciones El tipo de archivos a cargar debe ser de tipo

excel , el sistema lanzará un mensaje

notificando si hubo un error

− Documentación caso de uso Cargar Muestra de Datos

Código C2-01

Nombre Cargar Datos Históricos

Actores Invitado

Descripción Permite subir los datos históricos

Precondición El archivo a cargar debe ser de tipo excel

Flujo de eventos 1. El invitado se dirige a la sección de

cargar históricos

2. Selecciona el archivo a cargar

3. El sistema le muestra los datos

cargados

Poscondición

Excepciones El tipo de archivos a cargar debe ser de tipo

excel , el sistema lanzará un mensaje

notificando si hubo un error

Código C2-03

Nombre Establecer el tiempo de ejecución

Actores Invitado

Descripción Permite establecer cuánto tiempo durará la

ejecución del programa

Precondición El tiempo debe ser en minutos

Flujo de eventos 1. El invitado se dirige a la casilla de

tiempo ejecución

2. Digita la cantidad en minutos

Poscondición

Excepciones El tiempo de ejecución debe ser mayor a

cero, el sistema lanzará un mensaje

notificando si hubo un error

− Documentación caso de uso Establecer el tiempo de ejecución

Código C2-04

Nombre Generar Gráficos

Actores Invitado

Descripción Permite generar los gráficos de acuerdo al

pronóstico y valores reales

Precondición Se debe haber completado con éxito el

algoritmo preditictivo sobre el conjunto de

datos entregado

Flujo de eventos 1. El invitado se dirige a la sección

Graficar

2. El programa muestra las gráficas

generadas a través del conjunto de

datos reales y el pronosticado

Poscondición El invitado analiza los gráficos resultantes,

descarga reporte datos

Excepciones La carga de todos los conjuntos de datos y el

establecimiento del tiempo de ejecución

deben ser realizados con éxito, en caso

contrario el sistema lanzará mensajes de

alerta

− Documentación caso de uso Generar Gráficos

Código C2-05

Nombre Generar Reporte

Actores Invitado

Descripción Permite generar el reporte de datos, de

acuerdo al pronóstico y valores reales

Precondición Se debe haber completado con éxito el

algoritmo preditictivo sobre el conjunto de

datos entregado

Flujo de eventos 1. El invitado se dirige a la sección

Reportes

2. El programa muestra el reporte en

formato pdf

Poscondición descarga reporte datos

Excepciones La carga de todos los conjuntos de datos y el

establecimiento del tiempo de ejecución

deben ser realizados con éxito, en caso

contrario el sistema lanzará mensajes de

alerta

Código C2-06

Nombre Iniciar algoritmo de predicción

Actores Invitado

Descripción Permite iniciar la predicción sobre el

conjunto de datos entregados

Precondición Se debe haber cargado el conjunto de datos

históricos, el conjunto de datos de muestra y

el tiempo de ejecución

Flujo de eventos 3. El invitado se dirige a la sección de

Iniciar

4. El programa mostrará el estado de la

ejecución durante todo el proceso

5. El sistema finaliza y muestra los

datos estimados de la predicción

Poscondición El invitado analiza los gráficos resultantes,

descarga reporte datos

Excepciones La carga de todos los conjuntos de datos y el

establecimiento del tiempo de ejecución

deben ser realizados con éxito, en caso

contrario el sistema lanzará mensajes de

alerta

− Documentación caso de uso Iniciar algoritmo de predicción

Diagramas de secuencias

− Diagrama de secuencia: Cargar Datos Históricos

− Diagrama de actividad

ANEXO: MANUAL DE USUARIO APLICACIÓN

La aplicación de escritorio posee varias secciones, las cuales son:

− Carga de datos históricos

− Carga de datos muestrales para la predicción

− Control de tiempo de ejecución

− Resultados de Estimación

− Generación de reportes

− Imagen vista general.

Esta sección permite cargar los datos historicos. El boton inferior permite la descarga de

reportes

− Imagen carga de datos históricos

Esta sección permite cargar los datos muestrales a predecir, también existe una casilla

para mostrar el tiempo de finalización del algoritmo.

− Imagen carga de datos muestrales.

Esta sección permite mostrar el resultado de los datos pronosticados o estimados, también

existe una casilla para establecer el tiempo de finalización del algoritmo en minutos.

− Imagen resultado de datos pronosticados.

En esta sección permite visualizar el R^2, Iniciar o detener el proceso del algoritmo, como el de

reportar los gráficos generados.

− Imagen resultado de R^2

− Ejecución de la Aplicación

o Carga de Datos

- Imagen carga de datos

− Resultados de Ejecución

- Imagen resultado de ejecución

− Gráficos

− Imagen de gráficos generados

- Reportes

− Imagen reporte de resultados