Articulo Exponen y Potencial Últim

31
APLICACIÓN DE LOS MODELOS DE REGRESIÓN EXPONENCIAL Y POTENCIAL Resumen DEBE MOSTRARSE LOS QUE SE PRETENDÍA A TRAVÉS DE LA INVESTIGACIÓN REALIZADA. PARA EL CASO LA HIPÓTESIS Y SU COMPROBACIÓN. En este artículo se describe la aplicación de algunos modelos de regresión no lineal como herramienta propia de la estadística inferencial. Se explican los modelos de regresión exponencial y potencial mostrando su aplicación en diversas situaciones de la administración, la ciencia y la ingeniería. Específicamente, se desarrolla un caso real aplicado a las ciencias naturales (física) en el cual se establece las razones por las cuales se escoge un modelo sobre otro y se utilizan los resultados obtenidos para hacer predicciones dentro de un intervalo de confianza establecido. Corresponde a un quehacer emprendido por un grupo de docentes universitarios, preocupados por fortalecer la utilización del análisis cuantitativo de los datos, a través de técnicas propias de la inferencia estadística, como soporte en la ejecución oportuna y efectiva de procesos de toma de

description

exponen y poencial

Transcript of Articulo Exponen y Potencial Últim

Page 1: Articulo Exponen y Potencial Últim

APLICACIÓN DE LOS MODELOS DE REGRESIÓN EXPONENCIAL Y POTENCIAL

Resumen

DEBE MOSTRARSE LOS QUE SE PRETENDÍA A TRAVÉS DE LA INVESTIGACIÓN

REALIZADA. PARA EL CASO LA HIPÓTESIS Y SU COMPROBACIÓN.

En este artículo se describe la aplicación de algunos modelos de regresión no lineal como

herramienta propia de la estadística inferencial. Se explican los modelos de regresión

exponencial y potencial mostrando su aplicación en diversas situaciones de la administración, la

ciencia y la ingeniería. Específicamente, se desarrolla un caso real aplicado a las ciencias

naturales (física) en el cual se establece las razones por las cuales se escoge un modelo sobre otro

y se utilizan los resultados obtenidos para hacer predicciones dentro de un intervalo de confianza

establecido. Corresponde a un quehacer emprendido por un grupo de docentes universitarios,

preocupados por fortalecer la utilización del análisis cuantitativo de los datos, a través de

técnicas propias de la inferencia estadística, como soporte en la ejecución oportuna y efectiva de

procesos de toma de decisión, para la estimación y predicción de situaciones futuras.

Palabras clave: Regresión exponencial, regresión potencial, estimación, predicción, intervalo de

confianza.

Abstract

In this paper the application of some nonlinear regression models as a typical tool of inferential

statistics is described. Exponential potential models showing regression and its application in

various situations of management, science and engineering are explained. Specifically, a real

case applied to the natural sciences (physics) in which the reasons for which a model is chosen

over another are established and the results are used to make predictions within a confidence

interval is developed set. It corresponds to a task undertaken by a group of university professors,

Page 2: Articulo Exponen y Potencial Últim

concerned to strengthen the use of quantitative data analysis, through their own statistical

inference techniques to support the timely and effective implementation of decision-making

processes for estimating and predicting future situations.

Key words: Exponential regression, power regression, estimation, prediction, confidence

interval.

1. Introducción

Este artículo hace parte de una serie de documentos que constituyen el producto de una investigación docente cuyo objetivo es fomentar y fortalecer el uso de técnicas de estadística inferencial que mejoren la utilización de los datos que recopilan los estudiantes de pregrado o de posgrado en sus trabajos e investigaciones aplicadas en diferentes campos del conocimiento.

El análisis de regresión es una técnica de la estadística inferencial que permite, al investigador o al profesional, encontrar relaciones matemáticas entre las variables que intervienen en un proceso, experimento o situación que implique cambios en la información objeto de análisis. FUENTE

Por medio de estas relaciones se hacen estimaciones y predicciones sobre el comportamiento futuro de esas variables. Con las predicciones hechas se pueden tomar decisiones administrativas, establecer políticas o hacer diseños con base en los modelos matemáticos. FUENTE

De acuerdo con, Devore, J. (2005), el término regresión fue utilizado por primera vez como un concepto estadístico en 1877 por sir Francis Galton, quien llevó a cabo un estudio que mostró que la estatura de los niños nacidos de padres altos tiende a retroceder o “regresar” hacia la estatura media de la población. Designó la palabra regresión como el nombre del proceso general de predecir una variable (la estatura de los niños) a partir de otra (la estatura del padre o de la madre). Más tarde, los estadísticos acuñaron el término regresión múltiple para describir el proceso mediante el cual se utilizan varias variables para predecir otra.

En la terminología de la regresión, la variable que se va a predecir se llama dependiente a explicar, o endógena, mientras que la o las variables que se usan para predecir el valor de la variable dependiente se llaman variables independientes, explicativas o exógenas. También se les suele llamar regresando y regresores (Toro, García, Acero, Perea, & Vera, 2010)

PARA LA SIGUIENTE EXPLICACIÓN ELABORAR LAS GRÁFICAS, SOPORTAR CON FUENTES

En general, existen cuatro posibles formas en que las variables se pueden relacionar:

Relación lineal directa e inversa.

2

Page 3: Articulo Exponen y Potencial Últim

Figura 1. Relación Lineal

FUENTE: Levin & Rubin, 2004

Se considera que la relación es lineal si al graficar los datos se observa una distribución de los mismos alrededor de una línea recta (figura 1). La ecuación de la recta se determina a través del análisis de regresión por medio del modelo lineal.

Relación no lineal directa e inversa

Figura 2. Relación no lineal.

FUENTE: Levin & Rubin, 2004

Si la relación es no lineal, los datos observados se distribuyen alrededor de una curva y la ecuación de esa curva se determina a partir de alguno de los modelos no lineales. En la práctica, es muy común encontrar que la mayoría de las aplicaciones en las que se establecen relaciones entre variables sea del tipo no lineal.

Los modelos de regresión no lineal se clasifican en:

1. Modelos curvilíneos que se ajustan al modelo lineal general.

2. Modelos intrínsecamente lineales.

3. Modelos que no se pueden linealizar.

INCORPORAR DESCRIPCIONES EN LAS VIÑETAS. INCLUIR FUENTES

Los modelos no lineales que se ajustan al modelo lineal general, son aquellos que se pueden expresar como una combinación lineal entre las variables y los parámetros a estimar. Dentro de las relaciones curvilíneas que se pueden modelar con el modelo lineal general están: el modelo cuadrático, el cúbico, modelos polinómicos de orden superior, el modelo semilogarítmico (linear-log) y el modelo recíproco entre otros. FUENTE

3

Page 4: Articulo Exponen y Potencial Últim

Los modelos intrínsecamente lineales son aquellos en los que los parámetros no son lineales pero se pueden hacer transformaciones algebraicas para linealizar la relación. Dentro de las relaciones intrínsecamente lineales están: el modelo hiperbólico, el potencial, el exponencial y el logístico entre los más utilizados. FUENTE

Los modelos no lineales propiamente dichos son aquellos que no se pueden linealizar y se aplican otros métodos como el de estimación de máxima verosimilitud, el de Gauss-Newton, el de Newton-Raphson, entre otros. FUENTE

En este artículo se describe el análisis de regresión exponencial y potencial por medio de ejemplos aplicados a la economía, donde intervienen una variable dependiente y una independiente. Se hace el análisis de una situación particular en las ciencias naturales (física) cuyo objetivo es encontrar qué curva se ajusta mejor a los datos y decidir entre los dos modelos el que sea óptimo para hacer predicciones.

2. MARCO DE REFERENCIA TEÓRICA

2.1Modelo exponencial

La ecuación característica del modelo es (Minnaard, 2011)

La transformación lineal del modelo es:

Ecuación estimada de ajuste

Esta ecuación también se conoce con el nombre de semilogarítmica Log-lineal.

Este modelo es muy utilizado en economía para modelar funciones de riesgo, entendiendo estas como:

La probabilidad condicional instantánea de que un individuo experimente el suceso (muera) en el intervalo [t, t+∆t] dado que no lo ha experimentado (ha sobrevivido) en el tiempo t…Por ejemplo, en el estudio de la relación de la duración de un cliente con la empresa, la función de riesgo expresa la probabilidad de que dicha relación tenga una duración t (Gómez V., Polo R., & Fuentelsaz L.,

2004, 88)

La regresión exponencial también es utilizada para la aplicación de modelos de delimitación empírica de áreas metropolitanas basados en la difusión con la distancia de la concentración espacial. En el supuesto de isotropía del espacio metropolitano, la distribución tiende a ser en un área circular y está dada por la expresión:

4

Page 5: Articulo Exponen y Potencial Últim

En donde como variable dependiente representa la metropolitaneidad, la cual:

No es una magnitud directamente observable, sino una característica que sólo resulta parcialmente explicada a través de una serie de variables socioeconómicas que nos informan por separado sólo de algunos rasgos propios, tales como la aglomeración residencial, la terciarización, la concentración espacial de los flujos de transporte, del empleo de los centros de decisión, entre otras. (Martínez De Lejarza, I. & Martínez De Lejarza, J., 2002, 475)

Así pues esta variable dependiente expresa un indicador que considera el efecto de todas las variables socioeconómicas en conjunto.

En general, el modelo exponencial se usa cuando se observan cambios porcentuales en Y para cambios absolutos en X (Maúl, 2010)

Figura 3. Modelo exponencial

FUENTE: Elaboración Propia

Ejemplo 1

La tabla 1 muestra el rendimiento en millas por galón y los pesos en libras de 12 automóviles. Se desea encontrar la ecuación de regresión de mejor ajuste e interpretar el coeficiente de regresión que expresa la razón de cambio entre las variables.

5

Page 6: Articulo Exponen y Potencial Últim

Tabla 1. Millas por galón de combustible vs. Peso del automóvil

Peso (libras) X 2026 2106 2113 2180 2289 2448 2657 2702 2888 3213 3226 3607millas por

galón Y 33,3 30,5 29,2 34,2 28,7 27,9 23,9 26,4 20,9 19,5 18,1 14,3

FUENTE: Anderson, Sweeney, & Williams, 2001

Gráfica 1. Valores observados de millas por galón vs peso.

FUENTE: Elaboración Propia.

A simple vista los valores observados se distribuyen alrededor de una línea recta. Con ayuda de la herramienta de análisis de regresión del programa Excel® se obtienen los siguientes valores de los coeficientes y el análisis de varianza de la regresión lineal. (Vélez P., 2003)

Tabla 2. Regresión lineal para los datos del ejemplo 1.

Estadísticas de la regresiónCoeficiente de correlación múltiple 0,96715244Coeficiente de determinación R^2 0,93538384R^2 ajustado 0,92892223Error típico 1,67052649Observaciones 12

ANÁLISIS DE VARIANZA

Grados de

libertadSuma de

cuadradosPromedio de los

cuadrados FValor

crítico de FRegresión 1 403,975913 403,975913 144,76005 2,85E-07Residuos 10 27,9065874 2,79065874

6

Page 7: Articulo Exponen y Potencial Últim

Total 11 431,8825

Coeficientes Error típico Estadístico t

Intercepción 56,09568 2,58213542 21,7245306

Variable X 1 -0,01164356 0,00096775 -12,0316273

FUENTE: Elaboración Propia.

De acuerdo con los datos, la ecuación de regresión es:

El ajuste de la recta es muy bueno (r2=93,54%) y la relación es estadísticamente significativa ya que el valor de probabilidad del estadístico F es prácticamente cero (Cardona, D.; et al, 2013) (Reding B., Zamora M., & López A., 2011)

Gráfica 2. Residuos estandarizados de la regresión lineal.

Sin embargo, la gráfica de residuales (gráfica 2) muestra que no se cumple con el supuesto del modelo de que la varianza debe ser constante (Orellana, 2008, 11) y el residual estandarizado de la cuarta observación es superior a 2. Por tal motivo, se debe encontrar otro modelo y para ello se utilizará la ecuación (3) colocando como variable dependiente (tabla 3).

Tabla 3. Datos para la regresión exponencial.

Peso (libras)

millas por galón

X Y log y2026 33,3 1,522444232106 30,5 1,48429984

7

Page 8: Articulo Exponen y Potencial Últim

2113 29,2 1,465382852180 34,2 1,534026112289 28,7 1,45788192448 27,9 1,44560422657 23,9 1,37839792702 26,4 1,421603932888 20,9 1,320146293213 19,5 1,290034613226 18,1 1,257678573607 14,3 1,15533604

Aplicando el método de los mínimos cuadrados (Cardona, D; et al., 2013) a la ecuación (3) se obtienen las ecuaciones normales para estimar

Resolviendo el sistema de ecuaciones se tiene que Sin embargo, con ayuda de la herramienta de análisis de Excel® se obtienen también los estadísticos que permiten determinar si la relación es o no significativa.

Tabla 4. Estadísticas de la regresión exponencial

Estadísticas de la regresiónCoeficiente de correlación múltiple 0,97350163Coeficiente de determinación R^2 0,94770542R^2 ajustado 0,94247596Error típico 0,02790547Observaciones 12

ANÁLISIS DE VARIANZA

Grados de

libertadSuma de

cuadradosPromedio de los

cuadrados FValor crítico

de FRegresión 1 0,14112219 0,14112219 181,224411 9,8417E-08Residuos 10 0,00778715 0,00077872Total 11 0,14890934

Coeficientes Error típico Estadístico t Probabilidad

Intercepción 1,96484849 0,04313352 45,5526992 6,2573E-13

Variable X 1 -0,00021762 1,6166E-05 -13,4619616 9,8417E-08

8

Page 9: Articulo Exponen y Potencial Últim

Gráfica 3. Residuos estandarizados de la regresión exponencial

Los resultados del análisis de regresión exponencial (tabla 4) muestran un ajuste mejorado con respecto al lineal (r2=94,77%) y la gráfica (3) de residuales muestra que todos los residuos están en el intervalo [–2, 2] desviaciones estándar, además el patrón de varianza creciente desapareció.

Por consiguiente la ecuación de mejor ajuste es:

Aplicando el antilogaritmo se tiene:

El coeficiente de regresión se interpreta diciendo que por cada libra que aumente el peso del vehículo, se disminuye en 0,05% el rendimiento en millas por galón.

También es muy común utilizar el logaritmo natural para hacer la transformación lineal, pues la mayoría de programas estadísticos realizan los cálculos con ese logaritmo y los coeficientes que se obtienen son los mismos al aplicar el antilogaritmo.

9

Page 10: Articulo Exponen y Potencial Últim

Gráfica 4. Curva de ajuste exponencial.

2.2Modelo potencial

Ecuación del modelo (Minnaard, 2011)

La transformación lineal del modelo es:

Ecuación estimada de ajuste

Figura 4. Modelo potencial

Muy utilizado en ajustes de precio-demanda y en general se usa cuando se observan cambios porcentuales en y para cambios porcentuales en x (Maúl, 2010)

10

Page 11: Articulo Exponen y Potencial Últim

Al coeficiente se le conoce en economía como la elasticidad.

De acuerdo con Duarte (1996), en ingeniería eléctrica y electrónica, la regresión potencial se usa para modelar el comportamiento de la corriente con respecto al voltaje o viceversa en circuitos de resistores no lineales invariantes en el tiempo (RNLINT), los cuales tienen una única característica entre voltaje y corriente que los distingue. Estos dispositivos son de tipo pasivo, es decir, que la gráfica de corriente contra voltaje se ubica en el primer cuadrante donde ambas variables tienen un valor positivo y la corriente se puede expresar como potencia del voltaje de acuerdo con la ecuación (4) con positivo. Un caso muy común de este tipo de resistores es el diodo rectificador de silicio.

Según Campos_Aranda (2013), para estimar la creciente media (Qma) en una cuenca hidrográfica sin aforos, los hidrólogos emplean ecuaciones de regresión potencial, desarrolladas para una región homogénea, las cuales relacionan los valores observados de la Qma con diversas características fisiográficas de sus cuencas.

La ecuación de regresión potencial es útil también en relaciones de proporcionalidad inversa o en general relaciones inversas donde ninguna de las dos variables puede tomar el valor cero, es decir, que los ejes X y Y son asíntotas.

Ejemplo 2

La tabla muestra el porcentaje de personas en España, de 15 millones encuestadas, que no consumen licor (dentro del conjunto de bebidas locales) durante el fin de semana según la edad.

Tabla 5. No consumo de licor el fin de semana vs edad

Edadporcentaje de no consumidores

20 84,230 89,0340 90,6250 91,1960 93,2770 93,2680 95,54

FUENTE: Ministerio de Sanidad, Servicios Sociales e Igualdad, 2009

La gráfica (5) muestra los datos de la tabla anterior y se observa que la relación es curvilínea. También se observa que la distribución se parece a la de la ecuación potencial (4) con

(figura 4).

11

Page 12: Articulo Exponen y Potencial Últim

Gráfica 5. Datos observados de no consumo de alcohol vs. Edad

FUENTE: Elaboración propia.

Para ingresar los datos con el fin de hacer el análisis se debe calcular el logaritmo a los datos de x e y. En este caso se utilizará el logaritmo natural.

Tabla 6. Logaritmo de los datos de las variables edad y porcentaje de no consumidores.

Edad porcentaje de no consumidores

X Y ln x ln y20 84,2 2,995732272 4,4331949230 89,03 3,40119738 4,4889733940 90,62 3,688879452 4,5066749450 91,19 3,912023003 4,5129452460 93,27 4,09434456 4,5354985170 93,26 4,24849524 4,5353912980 95,54 4,382026632 4,55954501

FUENTE: Elaboración propia.

Haciendo el análisis de regresión lineal con Excel® utilizando las dos últimas columnas de datos se obtiene:

Tabla 7. Estadísticos de la regresión potencial.

Estadísticas de la regresiónCoeficiente de correlación múltiple 0,97738089

12

Page 13: Articulo Exponen y Potencial Últim

Coeficiente de determinación R^2 0,9552734R^2 ajustado 0,94632809Error típico 0,00950973Observaciones 7ANÁLISIS DE VARIANZA

Grados de

libertadSuma de

cuadradosPromedio de los

cuadrados FValor

crítico de FRegresión 1 0,00965759 0,00965759 106,790312 0,000146Residuos 5 0,00045218 9,0435E-05Total 6 0,01010976

Coeficientes Error típicoEstadístico

t Probabilidad

Intercepción 4,19931895 0,03030876 138,551322 3,7154E-10

Variable X 1 0,08146597 0,00788334 10,3339398 0,000146

FUENTE: Elaboración propia.

El anterior análisis muestra que la regresión potencial tiene un excelente ajuste (r2=95,53%) y es estadísticamente significativa.

La ecuación de regresión obtenida es:

Aplicando el antilogaritmo a los dos miembros de la ecuación:

13

Page 14: Articulo Exponen y Potencial Últim

Gráfica 6. Curva potencial de ajuste.

FUENTE: Elaboración propia.

3. METODOLOGÍA

En un experimento acerca de un fenómeno físico se obtuvieron datos de presión P (expresada en kilogramos por centímetro cuadrado) de un gas y los valores correspondientes del volumen V que ocupa (expresados en centímetros cúbicos).

Tabla 8 . Datos observados de volumen vs. Presión.

Volumen (V) 950 1081 1280 1593 1989 2250

Presión (P) 4,43 3,65 2,78 2,13 1,41 0,95

FUENTE: Elaboración propia.

Se desea encontrar la ecuación de dependencia estadística que mejor se ajuste a los datos observados y poder predecir el valor de presión del gas cuando su volumen es 2500 cm3.

Cuando se precisa encontrar la relación de dependencia estadística entre dos variables, una dependiente y otra independiente, se hace una gráfica de dispersión de los datos con el fin de estimar qué tipo de curva puede ajustarse mejor a partir de las observaciones.

14

Page 15: Articulo Exponen y Potencial Últim

Gráfica 7. Datos observados de presión vs. volumen del gas.

FUENTE: Elaboración propia.

De acuerdo con la gráfica, la distribución de los puntos sugiere que la relación de dependencia puede ser exponencial o potencial con .

Para realizar los análisis de regresión correspondientes, se deben tomar los valores de los logaritmos de cada uno de los datos que constituyen las variables.

Tabla 9. Datos observados de las variables del experimento y sus logaritmos.

Volumen (V) log V Presión (P) log P950 2,97772361 4,43 0,64640373

1081 3,03382569 3,65 0,562292861280 3,10720997 2,78 0,44404481593 3,20221578 2,13 0,32837961989 3,29863478 1,41 0,149219112300 3,36172784 0,95 -0,0222764

FUENTE: Elaboración propia.

Regresión exponencial:

En este caso el modelo es: P

Y la ecuación estimada de ajuste:

Haciendo el análisis con Excel® se obtiene:

Tabla 10. Análisis de regresión exponencial de los datos del problema.

Estadísticas de la regresión

15

Page 16: Articulo Exponen y Potencial Últim

Coeficiente de correlación múltiple 0,99778628

Coeficiente de determinación R^2 0,99557745

R^2 ajustado 0,99447181

Error típico 0,01884277

Observaciones 6ANÁLISIS DE VARIANZA

Grados de

libertad Suma de cuadradosPromedio de

los cuadrados F Valor crítico de FRegresión 1 0,31970694 0,31970694 900,455773 7,3454E-06Residuos 4 0,0014202 0,00035505Total 5 0,32112714

Coeficientes Error típico Estadístico tProbabilidad

Intercepción 1,08143528 0,02551734 42,3804119 1,853E-06

Variable X 1 -0,00047651 1,588E-05 -30,0075953 7,3454E-06

FUENTE: Elaboración propia.

Tabla 11. Análisis de residuales de la regresión exponencial.

Volumen ResiduosResiduos

estándares950 0,628751654 0,01765207 1,04738386

1081 0,566328964 -0,0040361 -0,239481551280 0,471503657 -0,02745886 -1,629268641593 0,322356316 0,00602329 0,357391141989 0,13365872 0,01556039 0,923274232300 -0,014535603 -0,00774079 -0,45929903

FUENTE: Elaboración propia.

De acuerdo con los resultados del análisis, la regresión exponencial muestra un excelente ajuste con los datos observados (r2=99,56%) y es estadísticamente significativa pues el valor de probabilidad del estadístico de prueba F (tabla 10) es prácticamente nulo. Además, cumple con el supuesto de varianza constante de acuerdo con los residuos (tabla 11), pues se observa que los residuos estandarizados se encuentran en el intervalo entre - 2 y 2 desviaciones estándar

Remplazando los valores de los coeficientes (tabla 10) en la ecuación de regresión (7), se tiene:

Aplicando antilogaritmos:

16

Page 17: Articulo Exponen y Potencial Últim

Regresión potencial:

En este caso el modelo es:

Y la ecuación estimada de ajuste:

Haciendo el análisis con Excel® se obtiene:

Tabla 12. Análisis de regresión potencial para los datos del problema.

Estadísticas de la regresiónCoeficiente de correlación múltiple 0,99317329Coeficiente de determinación R^2 0,98639318R^2 ajustado 0,98299147Error típico 0,03305117Observaciones 6

ANÁLISIS DE VARIANZA

Grados de

libertadSuma de

cuadradosPromedio de los

cuadrados FValor crítico

de FRegresión 1 0,31675762 0,31675762 289,97 6,9747E-05Residuos 4 0,00436952 0,00109238Total 5 0,32112714

Coeficientes Error típico Estadístico t Probabilidad

Intercepción 5,63510023 0,31058202 18,1436781 5,4263E-05

Variable X 1 -1,67019513 0,09808227 -17,028512 6,9747E-05

FUENTE: Elaboración propia.

Tabla 13. Análisis de residuales de la regresión potencial

Observación Pronóstico para Y ResiduosResiduos

estándares1 0,66172077 -0,01531705 -0,518135392 0,56801934 -0,00572648 -0,193711563 0,44545328 -0,00140848 -0,04764534 0,28677505 0,04160456 1,407372585 0,12573649 0,02348262 0,794355296 0,02035878 -0,04263517 -1,44223561

FUENTE: Elaboración propia.

17

Page 18: Articulo Exponen y Potencial Últim

Los resultados del análisis (tabla 12) muestran que la regresión potencial presenta un excelente ajuste con los datos observados (r2= 98,64%) y es estadísticamente significativa puesto que la probabilidad del estadístico de prueba F es prácticamente cero. Además, el análisis de residuales (tabla 13) evidencia que se satisface el supuesto de homocedasticidad pues no existe prueba alguna de que los residuos aumenten conforme aumenta la variable independiente y los residuos estandarizados se encuentran entre -2 y 2 desviaciones estándar.

Remplazando los valores de los coeficientes (tabla 12) en la ecuación de regresión (9), se tiene:

Calculando antilogaritmos:

CONCLUSIONES

¿Cuál de los dos modelos es el mejor para hacer predicciones?

Comparando los resultados del análisis de la regresión exponencial y de la regresión potencial se podría inferir que la regresión exponencial ofrece un mejor ajuste con respecto a los datos observados, pero es necesario tener en cuenta otros conceptos:

1. La diferencia entre estimación y predicción. Se pueden estimar parámetros poblacionales o valores de la variable dependiente a partir de valores de la variable independiente siempre y cuando estén dentro del rango de las observaciones; es importante tener en cuenta que una ecuación de estimación es válida sólo para el mismo rango dentro del cual se tomó la muestra inicialmente (Levin & Rubin, 2004). Predecir significa pronosticar, hacer una proyección o “adivinar” valores de la variable dependiente a partir de valores de la variable independiente que están fuera del rango de los datos observados; esto significa que se debe tener certeza sobre el comportamiento o relación entre las variables fuera del intervalo establecido por las observaciones y se requiere que el modelo estocástico establecido sea válido fuera del intervalo muestral y que el “horizonte de predicción no sea muy lejano” (Novales, 1993, 147).

2. El tipo de situación donde se presenta la relación de dependencia entre variables. Existen dos tipos de situaciones: determinísticas y aleatorias. Determinísticas son aquellas en las que se puede obtener el mismo resultado para una variable en una observación o experimento si se repite bajo las mismas condiciones y aleatorias son aquellas en las que no se puede determinar el resultado aunque se mantengan las condiciones y se tengan los mismos valores de las variables exógenas.

18

Page 19: Articulo Exponen y Potencial Últim

3. La relación causa y efecto entre las variables. Un error que se puede cometer es suponer que un cambio en una variable es “ocasionado” por un cambio en la otra variable. Los análisis de regresión y el coeficiente de determinación (r2) no pueden, de ninguna manera, determinar la causa y el efecto. “La validez de una conclusión de tipo causa y efecto requiere de una justificación teórica, o del buen juicio por parte del analista”. (Anderson, Sweeney, & Williams, 2001)

Parte de la mencionada justificación teórica se encuentra en la forma como se realiza la obtención de los datos o muestreo. De acuerdo con Orellana (2008), los datos pueden provenir de experimentos controlados o estudios observacionales; en un experimento el investigador puede controlar las variables exógenas con el fin de medir la influencia que tienen cada una de ellas en la variable dependiente, mientras que en los estudios observacionales no tienen control sobre algunas de las variables externas que pueden afectar o influir en las variaciones que sufra la variable dependiente. Si se dice, por ejemplo, que existe una relación estadísticamente significativa (bien sea lineal o no lineal) entre el número de canas y de arrugas que van apareciendo en una persona, no se puede decir que una ocasiona la otra pues es muy posible que existan otras variables asociadas que sean la causa; en este caso la edad de la persona. Así pues, si existe una relación de dependencia estadísticamente significativa proveniente de datos obtenidos a partir de un experimento controlado, se puede decir que la relación es causal.

Buscar una relación estadística entre la presión y el volumen de un gas constituye una situación de tipo determinístico y por extraer los datos a partir de un experimento controlado esta relación es de tipo causal.

Alrededor de esta experiencia se han desarrollado muchas teorías, definidas como leyes de los gases ideales, entre las que cabe destacar la ley de Boyle.

En 1659 Robert Boyle fabricó una bomba de vacío motivado por la lectura sobre los experimentos de Von Guericke sobre el vacío. Con este dispositivo conocido como motor de Boyle mostró que el sonido se transmitía como una vibración en el aire, verificó la afirmación de Galileo sobre la caída libre independiente del peso, mostró que la columna de mercurio en el barómetro de Torricelli se reducía a cero cuando se ponía en una cámara de vacío. (García T. & Ruiz C., 2010, 958)

Los experimentos que él hizo sobre el vacío lo llevaron al estudio de los gases lo que le permitió en 1662 establecer la dependencia entre la presión y el volumen de cualquier gas, enunciada de la siguiente manera: “para una cantidad determinada de gas, se encuentra que, con muy buena aproximación, el volumen de un gas es inversamente proporcional a la presión que se le aplica cuando se mantiene constante la temperatura” (Giancoli, 1995)

Es decir que, la presión de un gas a temperatura constante se puede modelar con :

Esto quiere decir que la relación que explica mejor la relación entre la presión y el volumen es la ecuación (10):

19

Page 20: Articulo Exponen y Potencial Últim

Intervalo de predicción:

Se desea encontrar el valor de presión para un volumen de 2500 cm3, entonces se remplaza el valor del volumen en la ecuación 10.

En la forma linealizada:

Los estimados puntuales, como el que se acaba de mostrar, no dan idea alguna de la precisión asociada con el valor estimado.

Para tal fin se deben determinar estimaciones de intervalo. El primer tipo de estimado es el de intervalo de confianza, que es un estimado del valor medio de para determinado valor de . El segundo tipo es el estimado de intervalo de predicción, que se usa cuando se desea un estimado de intervalo de valor individual de que corresponda a determinado valor de . “Con la estimación puntual se obtiene el mismo valor, sea que estemos estimando el valor medio de o prediciendo un valor individual de , pero con los estimados de intervalo se obtienen valores distintos” (Freund & Simon, 1994, 441).

Los cálculos para determinar un estimado del intervalo de predicción están basados en el método de los mínimos cuadrados aplicado al modelo lineal.

Primero debe calcularse la varianza asociada al empleo de como estimado de un valor individual de . Esta varianza está formada por la suma de dos componentes:

1. La varianza de los valores individuales de respecto del promedio cuyo estimado es 2

2. La varianza asociada al uso de para estimar E(yp) cuyo estimado es .

Así, el estimado de la varianza de un valor individual es:

Por consiguiente, un estimado de la desviación estándar de un valor un individual de es:

Donde es:20

Page 21: Articulo Exponen y Potencial Últim

Haciendo los cálculos a partir de las tablas 7 y 9 se tiene:

Finalmente, la ecuación general para un estimado del intervalo de predicción para un

valor individual de dado un valor particular de x es:

En donde el coeficiente de confianza es 1–α y se basa en una distribución t con n–2 grados de libertad.

Para determinar el intervalo de predicción de la presión cuando el volumen es 2500 cm3

con una confianza del 95% se tiene: ; . Remplazando en la ecuación 11:

Así el intervalo para es: [-0.16431 , 0.0840311]

Aplicando antilogaritmos: [0.685 , 1.2135]

Entonces, si el volumen del gas es 2500 cm3 se puede afirmar con una confianza del 95% que su presión está entre 0.685 y 1.2135 Kg/cm2.

CONCLUSIONES

En la estadística inferencial, el análisis de regresión es una herramienta que brinda la posibilidad de establecer relaciones de dependencia, y hacer estimaciones o predicciones en un intervalo de confianza deseado sobre las variables que intervienen en una situación particular. Existen modelos de regresión no lineal entre los que se destacan el modelo exponencial y el modelo potencial por tener una amplia gama de aplicaciones en la economía, la administración, las ciencias y la ingeniería.

Cuando el análisis de regresión sobre los datos de una situación dada sugiere que tanto el modelo exponencial como el potencial se ajustan muy bien a los valores observados, se debe escoger aquel que modele y represente la relación entre las variables fuera del intervalo muestral si existe la certeza y el conocimiento de ese comportamiento con el fin de hacer predicciones de

21

Page 22: Articulo Exponen y Potencial Últim

eventos futuros o fuera de lo medido y observado. En caso contrario, debe escogerse el modelo que mejores resultados haya obtenido en el análisis de regresión.

Los modelos de regresión no lineal constituyen un instrumento poderos pues le da al profesional la posibilidad de hacer estimaciones dentro del rango de los datos observados o predicciones utilizando datos por fuera del intervalo muestral si se tiene la certeza de que el comportamiento entre las variables se explica adecuadamente con la ecuación de dependencia estadística, especialmente cuando la información se recopiló a partir de un experimento controlado, permitiendo con ello hacer ajustes en los procesos, tomar decisiones y establecer políticas.

Referencias Bibliográficas.

Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2001). Estadística para administración y economía (7a ed., Vol. II). México: Thomson.

Campos_Aranda, D. (Octubre de 2013). Estimación de la creciente media anual en la Región Hidrológica Núm. 10 de México con base en ecuaciones de regresión potencial. Ingeniería, Investigación y Tecnología, XIV(4), 563-574.

Cardona M., D. F., González R., J. L., Rivera L., M., & Cárdenas V., E. H. (2013). Módulo de regresión lineal. Bogotá: Universidad del Rosario.

De Mendiburu, F. (2006). Modelos no lineales. Obtenido de Universidad Nacional Agraria La Molina: http://tarwi.lamolina.edu.pe/~fmendiburu/index-filer/academic/Foresteria%20I/Teoria/Teoria%20modelos%20no%20lineales.pdf

Devore, J. L. (2005). Probabilidad y estadística para ingeniería y ciencias (6a ed.). México: Thomson Learning.

Duarte Velasco, O. (1996). Circuitos con resistores no lineales. Bogotá: Universidad Nacional de Colombia.

Freund, J. E., & Simon, G. A. (1994). Estadística elemental (8a ed.). México: Prentice Hall.

García T., C., & Ruiz C., M. (Noviembre de 2010). La ley de Boyle, el análisis de dos experimentos. Latin-American Journal of Physics Education, 4, 957-962.

Giancoli, D. (1995). Física, principios con aplicaciones. México D.F.: Prentice Hall.

Gómez V., J., Polo R., Y., & Fuentelsaz L., L. (2004). Aplicaciones del análisis de supervivencia a la investigación en economía de la empresa. Cuadernos de Economía y Dirección de la Empresa, 19, 81-114.

Levin, R. I., & Rubin, D. S. (2004). Estadística para administración y economía. México: Pearson Educación.

22

Page 23: Articulo Exponen y Potencial Últim

Martínez De Lejarza, I., & Martínez De Lejarza, J. (2002). Delimitación de áreas metropolitanas mediante un modelo anisótropo de decrecimiento exponencial. Una aplicación al caso del área metropolitana de Valencia. Estudios de economía aplicada, 20-II, 471-486.

Maúl, H. (2010). Modelo de Regresión múltiple parte I. Obtenido de Universidad Francisco Marroquin: http://www.youtube.com/watch?v=pMKQKJY0jXI&list=PLD307E757E5488563

Miller, I. (2000). Estadística matemática con aplicaciones. (6a ed.). México: Pearson Educación.

Ministerio de Sanidad, Servicios Sociales e Igualdad. (2009). Encuesta Europea de Salud en España. Obtenido de Ministerio de Sanidad, Servicios Sociales e Igualdad: http://www.mspsi.es/estadEstudios/estadisticas/EncuestaEuropea/resultados.htm

Minnaard, C. (Agosto de 2011). Modelos de regresión lineales y no lineales: su aplicación en problemas de ingeniería. Revista Premisa, 13(50), 28-37.

Novales, A. (1993). Econometría (2ª ed.). Madrid: McGraw-Hill.

Orellana, L. (2008). Análisis de regresión. Obtenido de Departamento de Matemática. Universidad de Buenos Aires: http://www.dm.uba.ar/materias/estadistica_Q/2011/1/clase%20regresion%20simple.pdf.

Reding B., A., Zamora M., M., & López A., J. (2011). ¿Cómo y cuándo realizar un análisis de regresión lineal simple? Aplicación e interpretación. Revista Dermatología, 395-402.

Sancho P., A., Serrano, G., & Pérez, P. (2006). Econometría de Económicas. Obtenido de Universidad de Valencia: http://www.uv.es/~sancho/panel.pdf

Toro, P., García, A., Acero, R., Perea, J., & Vera, R. (2010). Modelos Econométricos para el Desarrollo de Funciones de Producción.

Vélez P., I. (2003). Apuntes de Probabilidad y Estadística para Ingeniería y Administración. Bogotá: Politécnico Gran Colombiano.

Walpole, R. E., & Myers, R. H. (1999). Probabilidad y estadística para ingenieros (6a ed.). México: Prentice Hall.

23