Analisis de regresion (2)

50
UNIVERSIDAD AUTONOMA GABRIEL RENE MORENO FACULTAD DE CIENCIAS ECONÓMICAS

Transcript of Analisis de regresion (2)

Presentacin de PowerPoint

ESTADSTICA IUNIVERSIDAD AUTONOMA GABRIEL RENE MORENOFACULTAD DE CIENCIAS ECONMICAS

ADMINISTRACION DE LA PRODUCCION Y CALIDADUNMSM - FQIQ - IQ - 2005 IIING.JOSE MANUEL GARCIA PANTIGOZO1

REGRESION LINEAL

DEFINICIN

Tcnica estadstica

ANLISIS DE REGRESIN LINEAL

utilizada

Para estudiar:Relacin entre variablesEn lo social:

Para predecir un amplio rango de fenmenos.Comenzando por:

Medidas econmicas, hasta diferentes aspectos del comportamiento humano. Se adapta a una amplia variedad de situaciones

En lo referente a la investigacin de mercados:

Puede utilizarse para :Determinar en cual de los diferentes medios de comunicacin es mas eficaz intervenir.o para predecir el numero de ventas de un determinado producto.

Clases de regresin lineal:

Clases de regresin lineal:Regresin lineal simpleRegresin lineal multiple

Regresin lineal simple:Este tipo se presenta cuando una variable independiente ejerce influencia sobre otra variable dependiente. Ejemplo: Y = f(x).Es una ecuacin que define la relacin lineal entre dos variables donde una variable depende de la otra variable. Se puede decir que Y depende de X.

Y = f(X) Como Y depende de X, entonces:Y es la variable dependiente, explicativa o de prediccin . X es la variable independiente o variable respuesta.

PRINCIPIO DE MINIMOS CUADRADOS

Tcnica empleada para obtener la ecuacin de regresin, minimizando la suma de los cuadrados de las distancias verticales entre los valores verdaderos de Y y los valores pronosticados de Y.

QU ES UN GRAFICO DE DISPERSION?Se trata de una representacin grfica del grado de relacin entre dos variables cuantitativas

DIAGRAMAS DE DISPERSION

INTRODUCCION:Este documento describe el proceso completo a seguir para analizar la existencia de una relacin lgica entre dos variables.Describe la construccin de los Diagramas de Dispersin a partir de la recogida de datos acerca de dichas variables y el anlisis posterior necesario para confirmar la correlacin que puede mostrar dicho diagrama, ya que sta no implica la existencia de una relacin lgica.

Es un tipo de diagrama matemtico que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos. Los datos se muestran como un conjunto de puntos, cada uno con el valor de una variable que determina la posicin en el eje horizontal y el valor de la otra variable determinado por la posicin en el eje vertical.DIAGRAMA DE DISPERSION:

CARACTERISTICAS

IMPACTO VISUALUn Diagrama de Dispersin muestra la posibilidad de la existencia decorrelacin entre dos variables de un vistazo.

COMUNICACINSimplifica el anlisis de situaciones numricas complejas.

GUA EN LA INVESTIGACINEl anlisis de datos mediante esta herramienta proporciona mayor informacinque el simple anlisis matemtico de correlacin, sugiriendo posibilidades yalternativas de estudio, basadas en la necesidad de conjugar datos y procesosen su utilizacin.

NUBE DE PUNTOS O DIAGRAMA DE DISPERSIN.Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresin.1Correlacin directa

La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.

2 Correlacin inversa

La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.

3 Correlacin nula

En este caso se dice que las variables son encorraladas y la nube de puntos tiene una forma redondeada.

Llamado tambin ajuste de curvas es una ecuacin dada en un grafico, dependiendo del grado de correlacin que mas se ajuste al conjunto de datos.

AJUSTE LINEAL: Y=BX+AAJUSTE LOGARITMICO: Y=B Ln X+AAJUSTE EXPONENCIAL: Y=AC BXAJUSTE PARABOLICO, CUADRATICO O POLINOMIAL: Y= AX2 + BX + A

Modelos de diagrama de dispersin

El diagrama de dispersin es una de las herramientas bsicas de control de calidad, que incluyen adems el histograma, el diagrama de Pareto, la hoja de verificacin, los grficos de control el diagrama de flujo.UN DIAGRAMA DE DISPERSIN PUEDE SUGERIR VARIOS TIPOS DE CORRELACIONES ENTRE LAS VARIABLES CON UN INTERVALO DE CONFIANZA DETERMINADO. LA CORRELACIN PUEDE SER POSITIVA (AUMENTO), NEGATIVA (DESCENSO), O NULA (LAS VARIABLES NO ESTN CORRELACIONADAS).

Cmo elaborar un diagrama de dispersin?

QUE HACER PARA ELABORAR UN DIAGRAMA DE DISPERSIN:

Obtener tabla de pares de valores con valores mximos y mnimos de cada variable.

2. Situar la causa sospechada en el eje horizontal.

3. Dibujar y rotular los ejes horizontales y verticales. 4. Trazar el rea emparejada usando crculos concntricos en pares de datos idnticos.

5. Poner ttulo al grfico y rotular.

6. Identificar y clasificar el modelo de correlacin.

7. Comprobar los posibles fallos en el anlisis

Cuando se emplea un diagrama de dispersin?

Se emplea cuando existe una variable que est bajo el control del experimentador.. Si existe un parmetro que se incrementa o disminuye de forma sistemtica por el experimentadorse le denomina parmetro de control o variable independiente = eje de x y habitualmente se representa a lo largo del eje horizontal

UN DIAGRAMA DE DISPERSION ME REPRESENTARa) Una relacin causalSolamente relaciones

b) Una explicacin lgica para establecer causa-efecto

LOS DIAGRAMAS DE DISPERSIN PUEDEN SER: De Correlacin Positiva Se caracterizan porque al aumentar el valor de una variable aumenta el de la otra. b. De Correlacin Negativa Sucede justamente lo contrario, es decir, cuando una variable aumenta, la otra disminuye. c. De Correlacin No Lineal. No hay relacin de dependencia entre las dos variables.

LINEA DE TENDENCIASegn sea la dispersin de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logartmica, Exponencial, Cuadrtica, entre otras.

Primero: Elaborar una teora admisible y relevante sobre la supuesta relacinentre dos variables.

Segundo: Recoger datos y construir el Diagrama.

Tercero: Identificar y clasificar la pauta de correlacin.

Cuarto: Discutir la teora original y considerar otras explicaciones.La construccin y clasificacin del Diagrama de Dispersin es la parte centraldel proceso. No es ni el principio ni el final.El anlisis de un Diagrama de Dispersin es un proceso de cuatro pasos:

Ventajas y desventajas de los diagramas de dispersin

VENTAJAS DE LOS DIAGRAMAS DE DISPERSION:

Se trata de una herramienta especialmente til para estudiar e identificar las posibles relaciones entre los cambios observados en dos conjuntos diferentes de variables.

Suministra los datos para confirmar hiptesis acerca de si dos variables estn relacionadas.

Proporciona un medio visual para probar la fuerza de una posible relacin.

Su utilizacin ser beneficiosa para el desarrollo de los proyectos abordados por los Equipos y Grupos de Mejora y por todos aquellos individuos u organismos w que estn implicados en la mejora de la calidad.

DESVENTAJAS DEL DIAGRAMA DE DISPERSIN:

No funciona si sucede que una dupla se repita

Solo se emplea cuando existe una variable que esta bajo el control del experimentador.

Un diagrama de dispersin puede sugerir varios tipos de correlaciones entre las variables .

CONCLUSIN

DIAGRAMA DE DISPERSION:

Su utilizacin ser beneficiosa para el desarrollo de los proyectos abordados por los Equipos y Grupos de Mejora y por todos aquellos individuos u organismos que estn implicados en la mejora de la calidad.

FORMA GENERAL DE LA ECUACION DE REGRESIN SIMPLE

Donde:Y se lee Y prima, es el valor pronosticado de la variable Y para un valor seleccionador de X.a es la ordenada de la interseccin con el eje Y, es decir, el valor estimado de Y cuando X=0, es decir, donde la recta de regresin cruza el eje Y.b es la pendiente de la recta, o el cambio promedio en Y por unidad de cambio en la variable independiente X.X es cualquier valor seleccionado de la variable independiente.

Y=a+bx

En general, los valores de a y b en la ecuacin de regresin se denominan coeficientes de regresin estimados, o tambin coeficientes de regresin.

Pendiente de la lnea de regresin

Donde:X es el valor de la variable independiente.Y es el valor de la variable dependiente.n es el numero de elementos en la muestra.

30

Para aplicar correctamente la regresin lineal deben satisfacerse varias suposiciones:Consideraciones bsicas para la regresin lineal:1.-Para cada valor de la variable X hay un conjunto de valores. 2.-Las desviaciones estndar de todas estas distribuciones normales son iguales.

3.-Las medias de estas distribuciones normales se encuentran sobre la lnea de regresin.

4.-Los valores de Y son estadsticamente independientes. Esto significa que al tomar la muestra un determinado valor de X no depende de ningn otro valor de X. Esta suposicin es especialmente importante cuando se toman los datos durante un periodo.

CALCULOS NECESARIOS PARA DETERMINAR LA ECUACION DE REGRESION DE MINIMOS CUADRADOSEJEMPLO:En la empresa Copier Sales of Amrica, la gerente de ventas recopilo informacin respecto al numero de llamadas telefnicas hechas y la cantidad de copiadoras vendidas, para una muestra de 10 representantes de ventas. A la seorita Madelei, gerente de esa rea, le gustara ofrecer informacin especifica referente a la relacin entre el numero de llamadas y la cantidad de productos vendidos. Utilice el mtodo de mnimos cuadrados para determinar la ecuacin lineal.

Encontrando b:

Luego a:

De modo que si un vendedor hace 20 llamadas telefnicas, puede esperarse que venda :Y=18.9476+1.1842(X)Y=18.9476+1.1842(20)Y=42.6316

El valor b=1.1842 , significa que para cada llamada adicional que realizan los representantes de ventas pueden esperar aumentar en casi 1.2 el numero de copiadoras vendidas.

El valor a=18.9476 es el punto donde la ecuacin cruza el eje Y. Una traduccin literal es que si no se hacen llamadas, esto es, X=0, se vendern 18.9476 copiadoras. Obsrvese que X=0 se encuentra fuera del intervalo de valores incluidos en la muestra, las llamadas a clientes fueron de 10 a 40, as que los clculos deben hacerse dentro de esa gama de valores.

El error de estndar de estimacin sirve para mostrar la semejanza que existe en concepto y calculo entre la desviacin estndar y el error estndar de estimacin.Supngase que se estudia un gran nmero de observaciones y que las cifras son grandes. Determine cada punto y sobre la recta de regresin y elevar al cuadrado las DIFERENCIAS ESTO ES (Y-Y), SERIA MUY TEDIOSO. LA FORMULA QUE SIGUE ES IDENTICA DESDE EL PUNTO DE VISTA ALGEBRAICO A LA ANTERIOR PERO ES MUCHO MAS FACIL DE UTILIZAR.

FORMULA PARA EL ERROR ESTANDAR DE ESTIMACION.

Al aplicar esta frmula sale el mismo resultado que se calculo antes. Se trata del mismo error estndar de estimacin.

Que describe la intensidad entre dos conjuntos Es el estudio de relacin que existe entre las variables dependientes e independientes.

COEFICIENTE DE CORRELACIN

VARIABLE DEPENDIENTE (Y)VARIABLES INDEPENDIENTES (X1, X2,......)VOLUMEN DE VENTAS, EN UNIDADESPrecio unitarioGasto de PropagandaPESO DE LOS ESTUDIANTESEstaturaEdadCONSUMO DE BIENES INDUSTRIALES POR AOIngreso disponibleImportacin de bienes de consumoUNIDADES CONSUMIDAS DE UN BIEN POR FAMILIAPrecio unitario del bienIngresoNmero de integrantes por familiaPRECIO DE UNA VIVIENDAN de habitacionesN de pisosrea construidarea techada , etc.

EJEMPLOS

Nuestro principal objetivo al analizar las dos variables X y Y, para poder determinar la relacin entre stas dos variables, es decir como se comportan las dos variables una con respecto a la otra

44

COEFICIENTE DE CORRELACIN

El Coeficiente de Correlacin (r): requiere variables medidas en escala de intervalos o de proporcin, que Vara entre -1 y 1.Valores de -1 1 indican correlacin perfecta.Valor igual a 0 indica ausencia de correlacin.Valores negativos indican una relacin lineal inversa valores positivos indican una relacin lineal directa

EJEMPLOS DE GRAFICAS DE CORRELACIN

LNEA RECTA y= a+bx CALCULA EL COEFICIENTE DE CORRELACIN R SIN UTILIZAR MEDIAS ARITMTICAS DE LAS VARIABLES MODELOS FORMULAS QUE NOS PERMITEN HALLAR EL COEFICIENTE DE CORRELACIN R DE PEARSON

TAMBIN SE PUEDE CALCULA EL COEFICIENTE DE CORRELACIN R UTILIZANDO LAS MEDIAS ARITMTICAS DE LAS VARIABLES

n= es el nmero de pares de observaciones. X= es la suma de los valores de la variable X. Y= es la suma de los valores de la variable Y. (X2)= es la suma de los cuadrados de los valores de la variable X. (X)2 = es el cuadrado de la suma de los valores de la variable X. (Y2)= es la suma de los cuadrados de los valores de la variable Y. (Y)2= es el cuadrado de la suma de los valores de la variable Y. XY= suma de los productos de X y Y.

LNEA RECTA y= a + bx CALCULA EL COEFICIENTE DE CORRELACIN R SIN UTILIZAR MEDIAS ARITMTICAS DE LAS VARIABLES

R= 0.759

Gracias!

50