Portafolio estadistica inferencial

93
UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI INGENIERÍA EN COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL INTERNACIONAL PORTAFOLIO DE ESTADÍSTICA INFERENCIAL ALUMNO: ESTEFANÌA RUANO DOCENTE: MSC. JORGE POZO NIVEL: SEXTO “A”

Transcript of Portafolio estadistica inferencial

UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI

INGENIERÍA EN COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL

INTERNACIONAL

PORTAFOLIO DE ESTADÍSTICA

INFERENCIAL

ALUMNO:

ESTEFANÌA RUANO

DOCENTE:

MSC. JORGE POZO

NIVEL:

SEXTO “A”

CAPÍTULO 1

SISTEMA INTERNCIONAL DE UNIDADES

1.1 TEÓRICO BÁSICO

Actividades:

Lectura del documento

Análisis de términos importantes

1.1.1 Lectura del documento

SISTEMA INTERNACIONAL DE UNIDADES

* El sistema internacional de unidades conocido como SI es una

herramienta de conversión de unidades, utilizado de acuerdo a la

unidad básica de cada país. Cuyo principal objetivo es dar a conocer

las similitudes de las diferentes unidades de medida.

Utilizado para la conversión de unidades, es decir transformar las

diferentes unidades de un sistema a otro. Todas las unidades,

independientemente del sistema que forme parte, no llevan punto

al final de su escritura.

Se usa en la mayoría de los países, creado en 1960 por la

Conferencia General de Pesos y Medidas. Una de las

características es que sus unidades están basadas en fenómenos

físicos fundamentales.

Está formado por dos clases de unidades: unidades básicas o

fundamentales y unidades derivadas.

UNIDADES BÁSICAS DEL SI:

El Sistema Internacional de Unidades consta de siete unidades básicas.

Son las que se utilizan para expresar las magnitudes físicas consideradas

básicas a partir de las cuales se determinan las demás. (WIKIPEDIA,

2011)

Magnitud física fundamental

Unidad básica o fundamental

Símbolo

Longitud Metro M

Masa Kilogramo Kg

Tiempo Segundo S

Intensidad de corriente eléctrica

amperio o ampere A

Temperatura Kelvin K

Cantidad de sustancia Mol Mol

Intensidad luminosa Candela Cd

De las unidades básicas existen múltiplos y submúltiplos, que se expresan

mediante prefijos.

Múltiplos y submúltiplos del SI:

Es frecuente que las unidades del S.I. resulten unas veces excesivamente

grandes para medir determinadas magnitudes y otras, por el contrario,

demasiado pequeñas. De ahí la necesidad de los múltiplos y los

submúltiplos. (TOCHTLI, 2011)

Múltiplos Submúltiplos

Factor Prefijo Símbolo

Factor Prefijo Símbolo

10+24 yotta Y

10-24 yocto Y

10+21 zetta Z

10-21 zepto Z

10+18 exa E

10-18 atto A

10+15 peta P

10-15 femto F

10+12 tera T

10-12 pico P

10+9 giga G

10-9 nano N

10+6 mega M

10-6 micro µ

10+3 kilo K

10-3 milli M

10+2 hecto H

10-2 centi C

10+1 deca Da

10-1 deci D

UNIDADES DERIVADAS DEL SI:

Mediante esta denominación se hace referencia a las unidades utilizadas

para expresar magnitudes físicas que son resultado de combinar

magnitudes físicas básicas.(WIKIPEDIA, 2011)

Magnitud Nombre Símbolo

Superficie metro cuadrado m2

Volumen metro cúbico m3

Velocidad metro por segundo m/s

Aceleración metro por segundo m/s2

cuadrado

Masa en volumen

kilogramo por metro cúbico

kg/m3

Velocidad angular

radián por segundo rad/s

Aceleración angular

radián por segundo cuadrado

rad/s2

UNIDADES DE LONGITUD:

La longitud es una magnitud creada para medir la distancia entre

dos puntos.

La unidad principal de longitud es el metro, pero existen otras

unidades para medir cantidades mayores y menores. (DITUTOR,

2010)

Las más usuales son:

1 km 1000m

1milla T 1609m

1m 100cm

1m 1000mm

1pie 30.48cm

1cm 10mm

1pulgada 2.54cm

1año luz 9,48*1015m

Ejercicios:

L=20millas a mm

L=3000000km a años luz

L=500pies a mm

L=200000millas a pulgada

L=37200m a km

UNIDADES DE MASA:

Masa es un concepto que identifica a aquella magnitud de carácter

físico que permite indicar la cantidad de materia contenida en un cuerpo.

Dentro delSistema Internacional, su unidad es el kilogramo. (WIKIPEDIA,

2011)

1kg 1000g

1kg 2.2lbs

1tonelada 20qq

1tonelada 907.20kg

1arroba 25lbs

1qq 4arrobas

1lb 16onzas

1onza 0.91428g

1lbs 454g

1SLUG 14.59kg

1UTM 9.81kg

Ejercicios:

Ejercicios:

M=30toneladas a arrobas

M=4000000 SLUG a toneladas

UNIDADES DE TIEMPO:

El tiempo es la magnitud física con la que medimos la duración o

separación de acontecimientos, sujetos a cambio, de los sistemas

sujetos a observación

La unidad de masa se transforma a la unidad de volumen:

1kg= 2,2 lbs = 1 litro= 1000cm3=1000ml

Es el período que transcurre entre el estado del sistema cuando

éste aparentaba un estado X y el instante en el que X registra una

variación perceptible para un observador.

El tiempo ha sido frecuentemente concebido como un flujo

sucesivo de microsucesos.

Su unidad básica en el Sistema Internacional es el segundo, cuyo

símbolo es s. (WIKIPEDIA, 2011)

1año 365.25

1año comercial 360días

1año 12meses

1mes 30días

1día 4semanas

1semana 7días

1día 24horas

1h 60min

1h 3600s

1min 60s

Ejercicios:

T=30semanas a min

T=376540000min a años

ÁREA (m2)

El área es una medida de la extensión de una superficie,

expresada en unidades de medida denominadas Unidades de

superficie.(WIKIPEDIA, 2011)

Un área también es una unidad de superficie equivalente a 100

metros cuadrados. Se la conoce como decámetro cuadrado,

aunque es más frecuente el uso de su múltiplo

denominado hectárea.(WIKIPEDIA, 2011)

1 hectárea 10.000 m2

1 acre 4050 m2

Se dará a conocer el área de varias figuras geométricas a continuación:

VOLUMEN (m3):

Una palabra que permite describir al grosor o tamaño que posee

un determinado objeto.

Sirve para identificar a la magnitud física que informa sobre la

extensión de un cuerpo en relación a tres dimensiones (alto, largo

y ancho).

Dentro delSistema Internacional, la unidad que le corresponde es

el metro cúbico (m3).(TOCHTLI, 2011)

1 m3 1000 000 cm3

1 litro 1000 cm3

1 galón 5 litros - Ecuador

3,785 litros - Estados Unidos

1 caneca 5 galones

Se detallará el volumen de algunas figuras geométricas a continuación:

Ejercicios:

M=7780m3 a gramos

Q=300000m3/meses a kg/s

q

v=200km/h a m/s

A=7000millas/h2 a pulgada/s2

Un jugador de básquetbol tiene una altura de 5 pies 15 pulgadas,

determinar su altura en m y cm

ht= h1 + h2

ht= 1.52m + 0.38m

Calcular cuántos gramos de arena hay en un tramo de playa de

0.5km de largo por 100m de ancho y una profundidad de 3m, se sabe

que el diámetro de 1m de arena es alrededor de 1mm

(1grano x 1.5x1014mm3)/0.523mm3= 2.87x1014gr

Un tráiler tiene 18m de largo una altura de 2.50 y un ancho de 2.90m.

Determinar cuántos quintales puede ubicarse en un tráiler.

Vo=lxaxh

Vo=18m x 250m x 2.90m = 130.5m

Un contenedor tiene una longitud de 50pies un ancho de 12pies y

una altura de 30pies. Determinar cuántas cajitas de un juguete

pueden traerse de otro país hacia el Ecuador si tiene una arista de 15

cm

Vo=lxaxh

Vo=50pies x 12pies x 30pies = 18000pies3

Vo=0.49pie3= 0.12pie3

18000/0.12= 150000 juguetes

Un tráiler tiene un contenedor de forma cilíndrica cuya longitud es:

a=15.40m y un r=30pulg. Determinar cuántos litros puede transitar

este tráiler.

Vo= (28091862.64cm3 x 1 litro)/ 1000000cm3= 28091.86 litros

Una bodega tiene una longitud de 50m de largo por 25m de ancho y

3m de altura. Determinar cuántas cajitas de manzana puedo ubicar

en esta bodega si tiene una longitud de 70cm de largo, 25cm de

ancho y una altura de 2.7pies

Vobodega=50m x 25m x 3m= 3750m3

Vocaja= 70cm x 25cm x 82.30cm = 144025 cm3

Vo= 3750m3/0.14m3=26037.15 cajas

LINKOGRAFÍA

DITUTOR. (2010). DITUTOR. Recuperado el 2012, de DITUTOR:

http://www.ditutor.com/sistema_metrico/unidades_longitud.html

SLIDESHARE. (2007). SLIDESHARE. Recuperado el 2012, de

SLIDESHARE: http://www.slideshare.net/minmenez/sistema-

internacional-de-unidades-ii

TOCHTLI. (2011). TOCHTLI. Recuperado el 2012, de TOCHTLI:

http://tochtli.fisica.uson.mx/fluidos%20y%20calor/m%C3%BAltiplos

_y_subm%C3%BAltiplos.htm

WIKIPEDIA. (2011). WIKIPEDIA. Recuperado el 2012, de WIKIPEDIA:

WIKIPEDIA

WIKIPEDIA. (2011). WIKIPEDIA. Recuperado el 2012, de WIKIPEDIA:

http://es.wikipedia.org/wiki/Tiempo

WIKIPEDIA. (2011). WIKIPEDIA. Recuperado el 2012, de WIKIPEDIA:

http://es.wikipedia.org/wiki/%C3%81rea

1.1.2. Análisis de términos importantes

Sistema de internacional de unidades: se lo debe de considerar

como una herramienta que permite utilizar un acuerdo a la unidad

básica de cada país, esto permite que exista una concordancia a

nivel mundial, con respecto a la conversión de unidades, es decir,

trasformar una unidad en otra para facilitar la comprensión en el

país interesado en comprender dichas medidas cualquiera que esta

sea.

Unidades básicas del SI: se denominan se esta manera a las más

utilizadas y que se deben saber, dentro de estas unidades básicas

tenemos los múltiplos y submúltiplos los cuales juegan un papel

importante en el momento determinar una medida.

Múltiplos y submúltiplos: están diseñados para representar

expresiones demasiado grandes o pequeñas, es usual en el SI que

se deban calcular dichas cantidades, por ello se los determina con

su respectivo valor, prefijo y símbolo.

Unidades derivadas del SI:Estas unidades están diseñadas para

expresar magnitudes físicas que son resultado de combinar

magnitudes físicas básicas

Unidades de Longitud:es una herramienta diseñada para medir

las distancias entre dos puntos, el metro es su principal unidad de

medición, pero también existen otras unidades que determinan

medidas más grandes o pequeñas como se lo evidencia en la tabla

de cantidades básicas que se muestra en el escrito.

Unidades de masa:estas unidades representan el aspecto físico,

es decir, la cantidad de material retenido por el cuerpo, en este

caso se puede decir la cantidad de peso como son el kg, libra,

gramo, etc. Pero es importante mencionar que las unidades de

masa se transforman a unidades de volumen.

Unidades de tiempo: el tiempo representa la duración o

separación de acontecimiento sujetos a cambios de acuerdo a un

artefacto de medición del tiempo, el reloj, de esto depende de que

el observador de un fenómeno determine el tiempo que transcurre,

al momento que sucede dicho fenómeno. Los más utilizados son el

año, mes, día, hora, etc.

Área:Ayuda a determinar la exención la extensión de un cuerpo

geométrico facilitando su cálculo con ayuda de las fórmulas de

cada una de las figuras geométricas.

Volumen:El volumen permite determinar el grosor de un objeto,

tomando en cuenta la magnitud del mismo, es decir, alto, largo, y

ancho. Para facilitar la obtención de resultados se empleará

fórmulas.

1.2. TEÓRICO AVANZADO

Actividad:

Resumen del tema mediante cuadro sinóptico

1.1.2. Sistema Internacional de Unidades (cuadro sinóptico)

SISTEMA

INTERNACIONAL

DE UNIDADES

CONCEPTO

Conocido como SI es una herramienta de

conversión de unidades, utilizado de acuerdo a

la unidad básica de cada país. Cuyo principal

objetivo es dar a conocer las similitudes de las

diferentes unidades de medida.

CLASES

DE

UNIDADES

BÁSICAS

Expresan magnitudes físicas, consideradas básicas a partir de las cuales se determinan las demás.

Longitud: metro (m)

Masa: kilogramo (kg)

Tiempo: segundo (s)

Intensidad de

corriente

eléctrica: Amperio(A)

Cantidad de

sustancia(mol)

Intensidad

luminosa: candela(cd)

MÚLTIPLOS Para

distancias mayores

1024

(yotta) 10

21 (zetta)

1018

(exa) 10

15 (peta)

1012

(tera) 10

9 (giga)

106 (mega)

103 (kilo)

102 (hecto)

101 (deca)

SUBMÚLTIPLOS

Para

fracciones del metro

10-24

(yocto) 10-

21 (zepto)

10-18

(atto) 10

-15 (femto)

10-12

(pico) 10

-9 (nano)

10-6

(micro) 10

-3(mili)

10-2 (centi)

10-1

(deci)

DERIVADAS

S Expresan magnitudes físicas que son resultado de combinar magnitudes físicas básicas.

Superficie:metro cuadrado (m2)

Volumen:metro cúbico (m3)

Velocidad:metro por segundo (m/s)

Aceleración: metro por segundo

cuadrado(m/s2)

Masa en volumen:kilogramo por metro cúbico

(kg/m3l)

Velocidad angular:radián por segundo (rad/s)

Aceleración angular:radián por segundo

cuadrado (rad/s2)

1.3. PRÁCTICO BÁSICO

Actividad

Realización de organizadores gráficos del tema

1.3.1. Sistema Internacional de Unidades (organizadores gráficos)

MAGNITUDES

FUNDAMENALES

Longitud (m)

Masa (kg)

Tiempo (s)

Intensidad de corriente eléctrica (A)

Temperatura (k)

Cantidad de sustancia (mol)

Intensidad luminosa (cd)

DERIVADAS

Aceleración (m/s^2)

Volomen (m^3)

Velocidad (m/s)

Fuerza (N)

Densidad (kg/m^3)

Area o Superficie (m^2)

MÚLTIPLOS Y SUBMÚLTIPLOS DEL SI

AREAS Y VOLUMENES DE LAS FIGURAS GEOMÉTRICAS

El sistema internacional de unidades conocido como SI es una herramienta de conversión de unidades, utilizado de acuerdo a la unidad básica de cada país. Cuyo principal objetivo es dar a conocer las similitudes de las diferentes

unidades de medida

Se usa en la mayoría de los países, creado en 1960 por la Conferencia General de Pesos y Medidas. Una

de las características es que sus unidades están basadas en fenómenos físicos fundamentales.

1.4. PRÁCTICO AVANZADO

Actividades:

Resolución de ejercicios

Resolución de problemas

1.4.1. EJERCICIOS

LONGITUD

1. 470pies a mm

2. 1850pulgadas a cm

3. 280m a pies

4. 4000000km a años luz

5. 1850cm a mm

6. 50 millas a pulgadas.

7. 25cm a mm

8. 3km a millas

9. 120 m a cm

10. 750pies a cm

11. 574millas a 1año luz

12. 32pulgadas a cm

13. 25745 cm a mm

14. 55870pulgadas a cm

MASA

1. 150 qq a lbs

2. 28 onzas a g

3. 17 U.T.M a kg

4. 25 arrobas a onzas

5. 38 toneladas a kg

6. 3000000 SIUG a g

7. 1800 lbs a g

8. 12 SIVG a U.T.M

9. 97qq a lbs

10. 80lbs a onzas

11. 184arrobas a g

12. 14onzas a g

1.4.2. PROBLEMAS

1. Un contenedor que mide 16 metros de largo 60 pulgadas de alto y

6 pies de ancho necesita ser llenada de cajas que miden 30x30x30

cm. Se necesita calcular cual será el total de cajas que

alcanzarían en el contenedor.

44593459,2/27000= 1651,6

R= en el contenedor alcanzarían 1651 cajas.

2. Se desea transportar un 1500 cajas de aceite las cuales poseen

una longitud de 54 cm, 15 pulgadas de alto y 10 pulgadas de

ancho. ¿Qué tamaño volumen ocuparía el contenedor que podría

llevar ese número de cajas?

R= El volumen del contenedor debe de ser de 783869,4 m3

3. Una bodega que posee las siguientes dimensiones 19 m de largo

3,5 metros de ancho y 2,5 m de alto. Se desea saber qué cantidad

de quintales sería capaz de guardar.

R= En la bodega caben 3665 quintales.

4. Un contenedor de forma cilíndrica va a trasladar gasolina; se

desea conocer cuántos galones alcanzan si el contenedor tiene

254 pulgadas de largo y un diámetro de 6 pies.

R= El contenedor llevara 49 galones de gasolina.

1.5. INNOVADOR

Actividades:

Proyectos

CAPÍTULO 2

CORRELACIÓN Y REGRESIÓN LINEAL

2.1. TEÓRICO BÁSICO

Actividades:

Lectura del documento

Análisis de términos importantes

2.1.1. Lectura del documento

CORRELACIÓN LINEAL

El análisis de correlación se dirige sobre todo a medir la fuerza de una

relación entre variables. El coeficiente de correlación lineal, r, es la

medida de la fuerza de la relación lineal entre dos variables. La fortaleza

de la relación se determina mediante la magnitud del efecto que cualquier

cambio en una variable ejerce sobre la otra. (JOHNSON, 1990)

Si X o Y son las dos variables en cuestión, un diagrama de la dispersión

muestra la localización de los puntos (X,Y) sobre un sistema rectangular

de coordenadas. Si todos los puntos del diagrama de dispersión parecen

estar en una recta, como la figura 14(a) y 14(b) la correlación se llama

lineal.(SPIEGEL, 1992)

Y Y Y

X X

(a) Correlación lineal positiva (b)Correlación lineal negativa (c)Sin correlación

Si Y tiende a crecer cuando X crece, como la figura anterior, la correlación

se dice positiva o directa. Si Y tiende a decrecer cuando X crece, como la

figura 14.1 (b), la correlación se dice negativa o inversa.

Si todos los puntos parecen estar sobre una cierta curva la correlación se

llama no lineal, y una ecuación no lineal será apropiada para la regresión.

Como hemos visto en el capítulo 13 es claro q la correlación no lineal

puede ser positiva o negativa.

Si no hay relación entre las variables como la figura 14.1(c), decimos que

no hay correlación entre ellas. (SPIEGEL, 1992)

Técnicas de correlación

A continuación abordaremos el estudio de dos variables y no solamente

de una, estudiaremos qué sentido tiene afirmar que dos variables están

relacionadas linealmente entre si y cómo podemos medir esta relación.

Relaciones lineales entre variables

Supongamos que dispongamos de dos pruebas de habilidad mental y la

otra pruebe de ingreso a la universidad, seleccionamos a cinco

estudiantes que se expresan en la tabla N° 1 con los puntajes obtenidos

en estas dos pruebas.

Estudiantes X Prueba de habilidad

Mental

Y Examen de Admisión

María Olga

Susana Aldo Juan

18 15 12 9 3

82 68 60 32 18

La tabla nos dice que si podemos usar para pronosticar el puntaje alto en

la prueba de habilidad mental y también en los que tienen un puntaje alto

en los exámenes de admisión y los estudiantes con puntajes bajos en la

en el examen de habilidad como en el de admisión. En circunstancias

como la presente (cuando los puntajes altos de una variable están

relacionados con los puntajes altos de otra variable y los puntajes bajos

están relacionados con los puntajes bajos de otra variable) entonces

podemos asegurar que existe una relación positiva entre las dos

variables.

Supongamos que en lugar de los resultados de la tabla N° 1 hubiera

obtenido los puntajes que se muestran en la tabla N°2 ¿Podremos afirmar

que con estos datos en esta situación en la prueba de habilidad pueda

usarse para pronosticarse los puntajes del examen de admisión?

También, aunque en este caso los puntajes altos apresen con un puntaje

bajo, tomando en cuenta esto podemos definir una relación lineal negativa

entre el conjunto.

Estudiantes X Prueba de habilidad

Mental

Y Examen de Admisión

María Olga

Susana Aldo Juan

18 15 12 9 3

18 32 60 68 82

Estudiantes X Prueba de habilidad

Mental

Y Examen de Admisión

María Olga

Susana Aldo Juan

18 15 12 9 3

18 82 68 60 32

En este caso no podemos afirmar una relación lineal entre las variables X

y Y ya que unos puntajes se acotejan con otros y no están en

concordancia.

DIAGRAMA DE DISPERSIÓN

El diagrama de dispersión es útil para representar valores como lo

mostraremos a continuación utilizando los datos de la tabla N° 1, pero en

la vida real no todas las veces obtendremos datos de cinco parejas,

tendremos que comprender muchos más datos por esto es más sencillo

utilizar un diagrama para determinar la relación de los mismos.

COEFICIENTE DE CORRELACIÓN RECTILÍNEA DE PEARSON

Con la ayuda de las graficas nos podemos formar una idea de la nube de

puntos o diagrama de dispersión, representa la relación lineal es positiva

o negativa y determinar la fuerza de relación.

El coeficiente de Pearson, toma valores entre -1 y +1, el coeficiente 0

demuestra que no existe correlación, así que independiente del numero

sea negativo o positivo son iguales, claro esta que entre mas se aproxime

al 1 o -1 mayor será la fuerza de relación.

CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS

EN CLASES

Aquí podremos calcular el coeficiente de correlación r, que nos

proporciona información de la fuerza de la relación que existe entre dos

conjuntos de datos que se encuentran agrupados, cada uno de ellos

formando por separado una distribución de frecuencias, mejor dicho

teniendo por separado sus intervalos de clase con sus respectivas

frecuencias.

Ejemplo

Calcular el grado de correlación entre las puntuaciones obtenidas en un

inventario de hábitos de estudio y los puntajes obtenidos en un examen

de Matemática, aplicados a un total de 134 alumnos de un colegio de la

localidad.

X Hábitos de Y estudio Matemática

20→30

30→40

40→50

50→60

Totalfy

70 → 80 3 2 2 7

60 → 70 1 0 4 5 10

50 → 60 2 6 16 3 27

40 → 50 4 14 19 10 47

30 → 40 7 15 6 0 28

20 → 30 8 2 0 1 11

10 → 20 1 1 2 4

Total fx 23 40 48 23 134

Este cuadro muestra, en la primera columna del lado izquierdo los

intervalos de clase de la variable Y, los que cubren todos los posibles

datos acerca de las puntuaciones alcanzadas por los estudiantes de las

pruebas de matemática. Nótese que los intervalos los crecen de abajo

hacia arriba. En la fila superior se presentan los intervalos de clase todos

los 134 posibles datos a cerca de los puntajes obtenidos por los

estudiantes en la variable de estudio representada por la letra X.

En los casilleros inferiores de la tabla, se encuentran las frecuencias de

celda fxy, que corresponden a puntajes que pertenecen tanto a un

intervalo de la variable Y como a un intervalo de la variable X.

En la fila inferior del cuadro se presentan los totales de los puntajes de la

variable X, hábitos de estudio. Esos totales se llaman frecuencias

marginales de la variable X y se representan por fx.

En la última columna de la derecha se encuentran los totales de los

puntajes de la variable rendimiento en matemática. Estos totales se

denominan frecuencias marginales de la variable Y.

Cuando los datos se presentan, tal como el presente caso, formando

tablas de doble entrada, es conveniente usar el método clave que se

expone a continuación porque con este procedimiento se evita manejar

grandes números, como sería el caso si se emplearan las fórmulas para

trabajar con la calculadora.

Fórmula

Para obtener los datos que deben aplicarse en la fórmula, vamos a

construir un cuadro auxiliar, al mismo tiempo que se explica el significado

de los símbolos de esa fórmula.

Lo primero que hacemos es remplazar los intervalos horizontales y

verticales por sus respectivas marcas de clase; a continuación

adicionamos al cuadro anterior cinco columnas por el lado derecho; cuyos

encabezamientos son: fypara la primera uypara la segunda, para la

tercera, para la cuarta y para la quinta.

Por la parte inferior del cuadro le adicionamos cuatro filas que se

nombran: para la primera, para la segunda fila que está debajo de la

anterior, para la tercera fila y por último para la cuarta fila que

está debajo de todas; de esta manera se va elaborando el Cuadro auxiliar

4.1.8

1) Para determinar las frecuencias marginales que se deben colocar en la

columna sumamos las frecuencias de las celdas que están en la

misma fila de la marca de la clase 75, obtenemos: 7, número que se

escribe en el primer casillero o celda de la columna . En la fila de la

marca de la clase 65, sumamos 1+4+5 = 10, número que se escribe

debajo del 7.

Para la fila de la marca de clases 55, tenemos: 2+6+16+3 = 27

Para la fila de la marca de clases 45, se tiene 4+14+19+10= 47

En igual forma: 7+15+6=28

Lo mismo 8+2+1=11

Y en la ultima fila 1+1+2=4

A continuación sumamos estas frecuencias marginales de la variable

Y: 7+10+27+47+28+11+4=134 es el total general.

2) Ahora vamos a determinar las frecuencias marginales de la variable X:

En la columna encabezada con la marca de la clase 25 sumemos

verticalmente las frecuencias: 1+2+4+7+8+1= 23.

En la columna encabezada con 35, tenemos: 3+6+14+15+2= 40

En la siguiente: 2+4+16+19+6+1=48

En la última: 2+5+3+10+1+2=23

3) Centremos nuestra atención en la columna encabezada , este signo

significa desviación unitaria, y procedemos en la misma forma que en

las Tablas N° 2.1.2 y N° 2.1.3 (b). Recuerden que las desviaciones

unitarias positivas: +1,+2 y +3 corresponden a los intervalos mayores y

por el contrario las desviaciones unitarias negativa: -1,-2 y-3

corresponden a los intervalos menores. Como origen de trabajo se

tomó la marca de clase 45 y por lo tanto su desviación unitaria es cero

4) Luego vamos a determinar las desviaciones unitarias horizontales de

la variable X: El origen de trabajo es la marca de la clase 45 que se

halla en la fila superior del cuadro, por esa razón, escribamos cero

debajo de la frecuencia marginal 48. Las desviaciones unitarias

negativas: -1 y -2 se escriben a la a la izquierda cero, porque se

corresponden con los intervalos de clase que tienen menores marcas

de clase y que están a la izquierda de 45. La desviación unitaria

positiva, se corresponde con el intervalo de mayor marca de clase ,55

(en la parte superior del Cuadro N°. 4.1.8)

5) A continuación vamos a determinar los valores que deben colocarse

en la columna encabezada ; este símbolo indica que se debe

multiplicar cada valor de por su correspondiente valor . Así:

7(+3)=21; 10(+2)=20; 27(+1)= 27; 47(0)=0; 28(-1)= -28; 11(-2)= -22; y

4(-3)= -12. Sumando algebraicamente, tenemos: 21+20+27=68 los

positivos: y (-28)+(-22)+(-12)= -62 los negativos.

Por último: 68-62=6 total, que se coloca en la parte inferior de la columna.

Para obtener los valores de la cuarta columna encabezada debemos

tener en cuenta que por lo tanto basta multiplicar cada

valor de la segunda columna por su correspondiente valor de la tercera

columna así se obtiene el respectivo valor de la cuenta columna. En

efecto:

(+3)(21)=63; (+2) (20)=40; (+1) (27)=27; 0*0=0; (-1)(-28)=28; (-2)(-22)=44

y (-3)(-12)=36.

La suma: 63+40+27+28+44+36=238

Ahora nos fijamos horizontalmente en la tercera fila. Tenemos que

= por consiguiente basta multiplicar verticalmente un valor de la

primera fila por su correspondiente valor de la segunda fila para obtener el

respectivo valor de la tercera fila.

(23)(-2)= -46; (40)(-1)= -40; (48)(0)=0 y (23)(+1)=23

Sumando horizontalmente

(-46) + (-40) + (23)= -86+23=-63

Vamos por la cuarta fila; vemos que Luego basta

multiplicar cada elemento de la segunda fila por su correspondiente

elemento de la tercera fila para obtener el respectivo elemento de la

cuarta fila así:

(-2)(-46)= 92; (-1)(-40)= 40; 0*0=0 y (+1)(23)=23

Para obtener los valores de la quinta columna observemos que

hay tres factores: el 1° es la frecuencia de la celda o casillero que se

está considerando, el segundo factor es la desviación unitaria , el tercer

factor es la desviación unitaria . Por tanto el procedimiento será el

siguiente: Tomamos el número 3 que es la frecuencia de la celda

determinada por el cruce de los intervalos que tienen la marcha de clase

75 horizontalmente y 35 verticalmente.

CUADRO AUXILIAR N° 4.1.8

25 35 45 55 Suma de los

números

encerrados en

semicírculos en

cada fila

75 0 0 3 -9 2 0 2 6 7 +3 21 63 3

65 1 -4 0 0 4 0 5 10 10 +2 20 40 6

55 2 -4 6 -6 16 0 3 3 27 +1 27 27 7

45 4 -4 14 0 19 0 10 0 47 0 0 0 0

35 7 14 15 15 6 0 0 0 28 -1 -28 28 29

25 8 32 2 4 0 0 1 -2 11 -2 -22 44 34

15 1 6 0 0 1 0 2 -6 4 -3 -12 36 0

23 48 23 134 6 238 59

-2 0 +1

-46 0 23 -63

92 40 0 23 155

X Hábitos de estudio

Y Matemática

La fórmula del paso (9) lleva el signo∑ para indicar que se deben sumar

horizontalmente los números que están encerrados en los semicírculos de

esa primera fila elegida así: -9+0+6 = -3

Este número se escribe en la quinta columna

Trabajemos con la segunda fila (1)(-2)(+2)= -4 se encierra en una

semicírculo

(0)(-1)(+2)= 0

(4)(0)(+2)=0

(5)(+1)(+2)=10

Sumando 0+0+10=10

Ahora con la tercera fila:

(2)(-2)(+1)=-4

(6)(-1)(+1)=-6

(16)(0)(+1)=0

(3)(+1)(+1)=3

Sumando: (-4) + (-6)+3+3=-7

Cuarta fila

(4)(-2)(0)=0 todos los productos valen cero, luego la suma=0

Quinta fila

(7)(-2)(-1)=14

(15)(-1)(-1)=15

(6)(0)(-1)=0

(0)(+1)(-1)=0

La suma es 14+15=29

(8)(-2)(-2)=32

(2)(-1)(-2)=4

(0)(0)(-2)=0

(1)(+1)(-2)= -2

La suma es: 32+4-2=34

Séptima fila:

(1)(-2)(-3)=6

(1)(0)(-3)=0

(2)(1)(-3)=-6

Sumando: 6+0-6=0

Sumando los valores de la columna quinta.

-3+6-7+0+29+34+0=69-10=59

Reuniendo los resultados anteriores, se tienen los datos para apliar en la

fórmula N° 4.1.2.

n= 134

Ejercicio Resuelto N°2 de Cálculo de Coeficiente de Correlación

entre dos Conjuntos de Datos Agrupados.

Puntuación en Matemáticas Puntuación en Física

40→50 50→60 60→70 70→80 80→90 90→100 TOTAL

90→100 2 5 5 12

80→90 1 3 6 5 15

70→80 1 2 11 9 2 25

Calcular el coeficiente de correlación lineal de las puntuaciones en

matemáticas y física de 100 estudiantes de la Facultad de Ciencias de la

Universidad MN.

PROBLEMA PRÁCTICO

En el presente problema se calcula el coeficiente de correlación lineal r

para dos conjuntos de datos, constituidos por los calificativos en una

escala de 0 a 100, en matemáticas y en física para 100 estudiantes de la

facultad de ciencias de cierta universidad.

Los datos se muestran en el siguiente cuadro.

60→70 2 3 10 3 1 19

50→60 4 7 6 1 18

40→50 4 4 3 11

TOTAL 10 15 22 20 21 12 100

A continuación se procede a calcular el coeficiente de correlación r para

estos datos.

Se traslada los datos del cuadro 4.1.9. al cuadro 4.1.10 se llamara xy a

cualquiera de las frecuencias de los casilleros interiores del cuadro 4.1.9.

En el cuadro 4.1.10. Se puede observar que se han agregado 5 columnas

por el lado derecho y cuatro filas por la parte inferior.

Se observa en el cuadro 4.1.10 que los intervalos para la puntuación en

matemáticas y para la puntuación en física se han remplazado por las

marcas de clase correspondientes.

A continuación se realizará los pasos siguientes:

1. Para las frecuencias marginales fy se suma todos los valores fxy

de la primera fila que tiene la marca de clase 95 de esta forma

tenemos: 2+5+5=12 y así con las siguientes marcas de clase.

2. Se debe enfocar en las frecuencias marginales fx. el primer

resultado de fxse lo obtiene sumando las fxy para la columna que

tiene la marca de clase 45 de esta forma se tiene: 2+4+4= 10 que

se escribe en el primer casillero de la fila fx. Continuando con la

suma de las fx de las demás columnas se llena las frecuencias

marginales fx.

3. Arbitrariamente se escoge un casillero de la columna Uy, como

origen de trabajo y se le asigna el numero 0. Desde el cero hacia

arriba las desviaciones unitarias serán positivas y crecientes.

4. Se observa la fila Ux. se elige como origen de trabajo

arbitrariamente uno de los casilleros de Ux, el tercero contando de

izquierda a derecha, y se va asignando números positivos

crecientes hacia la derecha del 0.

5. Se multiplica cada valor de fypor su correspondiente valor de uyde

esta manera se obtiene un valor fyuy

6. La primera celda de la columna fyu2y se obtiene multiplicando uy de

la segunda columna por su correspondiente valor fyuyde la

siguiente columna de esta manera se continua llenando los demás

valores de la columna fyu2y.

7. La fila fxux se obtiene multiplicando la frecuencia marginal fxpor su

correspondiente desviación unitaria ux.

8. El primer casillero de la fila fxu2x es el resultado de multiplicar el

primer casillero de la fila fxux por su correspondiente casillero de la

fila ux.

9. Multiplicamos el valor de la frecuencia fxy del casillero para el cual

se hace el cálculo por los valores de la desviaciones unitarias uy y

ux obtenidas corriendo la vista hacia la derecha hasta la columna

uyy también hacia abajo hasta llegar a la fila ux

Para todas las filas, en el último casillero de la derecha se tiene la suma

de los valores de la fila. Estos totales de filas y columnas remplazamos en

la fórmula:

Bibliografía

HOWAR B. CHRISTENSEN. (1990). ESTADISTICA PASO A PASO. En

H. B. CHRISTENSEN, ESTADISTICA (págs. 557-590). TRILLAS:

TRILLAS.

JOHNSON, R. (1990). Análisis descriptívo y presentación de datos

bivariados. En ESTADÍSTICA ELEMENTAL (pág. 82 ~ 112). Belmont:

Wadsworth Publishing Company Inc.

Johnson, R. R. ((1990(reimp 2009))). Análisis descriptivo y presentación

de datos bivariados. En Estadística Elemental (Segunda ed., págs. 83 -

112). México, México: Trillas.

Martínez Bencardino, C. ((mayo 2007)). Regresión y Correlación. En

Estadística Básica Aplicada (Tercera ed., págs. 213-239). Bogotá,

Colombia: Ecoe Ediciones.

SPIEGEL, M. (1992). Teoría de la correlación. En ESTADÍSTICA (págs.

322 - 356). MÉxico D.F.: Mc GRAW-HILL.

2.1.2 Análisis de términos importantes

Correlación.-correlación es aquello que indicará la fuerza y

ladirección lineal que se establece entre dos variables aleatorias.

Coeficiente de Correlación.- es un índice que mide la relación lineal

entre dos variables aleatorias cuantitativas. A diferencia de la covarianza,

la correlación dePearson es independiente de la escala de medida de las

variables.

Regresión lineal.- método matemático que modeliza la relación entre

una variable dependiente Y, las variables independientes Xi

Rectas de Regresión.- son las rectas que mejor se ajustan a la nube de

puntos (o también llamado diagrama de dispersión)

Dispersión.- es una gráfica de parejas de valores X y Y

2.1 TEÓRICO AVANZADO

Actividad:

Resumen del tema mediante cuadro sinóptico

2.2.1 Correlación y Regresión Lineal (cuadro sinóptico)

CONCEPTO

Aquello que indicará la fuerza y

ladirección lineal que se establece entre

dos variables aleatorias.

TÉCNICAS DE

CORRELACIÓN

Estudio de dos

variables y su relación

lineal entre sí.

2.3 PRÁCTICO BÁSICO

Actividad

Realización de un organizador gráfico del tema

2.3.1 Correlación y Regresión Lineal (mapa conceptual)

CORRELACIÓN

COEFICIENTE

DE

CORRELACIÓN

Cuantifica la fuerza de relación entre dos variables.

Toma valores comprendidos entre +1 y -1

pasando por 0.

Se obtiene r=0 cuando no existe ninguna

correlación entre las variables.

FORMULA DE

COEFICIENTE

FÓRMULA DE

COEFICIENTE

(DOBLE ENTRADA)

2.4 PRÁCTICO AVANZADO

Actividades:

Resolución de ejercicios

2.4.1 EJERCICIOS

Correlación y Regresión Lineal

COEFICIENTE DE CORRELACIÓN

Cuantifica la fuerza de relación entre dos

variables.

Toma valores comprendidos entre

+1 y -1 pasando por 0.

Se obtiene r=0 cuando no existe

ninguna correlación entre las variables

FÓRMULA DE COEFICIENTE

FÓRMULA DE COEFICIENTE(DOBLE

ENTRADA)

Estudio de dos variables y su relación

entre si.

X 2005

Y 2006

Enero 165 173

Febrero 150 154

Marzo 163 163

Abril 156 163

Mayo 162 169

Junio 162 160

155 165 175 Suma de los

números

encerrados en

semicírculos en

cada fila

155 1 1 1 +1 1 1 1

X 2005

Y 2006

165 2 2 44 6 0 0 0 6

175 1 0 1 -1 -1 1 1

3 5 0 8 0 -1 2 8

-1 0 1 0

-3 0 0 -3

3 0 0 3

2.5 INNOVADOR

Actividades:

Proyectos

UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI

FACULTAD DE COMERCIO INTERNACIONAL, INTEGRACIÓN,

ADMINISTRACIÓN Y ECONOMÍA EMPRESARIAL

ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL

INTERNACIONAL

TRABAJO DE ESTADÍSTICA INFERENCIAL

INTEGRANTES:

NATHALY CHAMORRO

STALIN GOYES

KARINA LEMA

ESTEFANÍA RUANO

ERIKA TARAPUÉS

MARITZA VALLEJO

MSC. JORGE POZO

NIVEL: SEXTO “A”

2012/05/07

TEMA: Correlación y Regresión Lineal.

PROBLEMA

El desconocimiento de la Correlación Lineal no ha permitido que el

estudiante resuelva problemas de estadística.

ABSTRACT

The study of the behavior of two variables, in order to determine if some

functional relation exists between yes, causes and effect, in addition, of

quantifying the above mentioned degree of relation the analysis

simultaneous of two-dimensional variables as for example: production and

consumption; sales and usefulness; expenses in advertising and value in

sales; high wages and working hours; wages and productivity; income and

expenses; etc. The investigation is of great usefulness in the resolution of

problems of the context of the career of Exterior Trade.

OBJETIVOS

OBJETIVO GENERAL

Conocer el conceptode correlación lineal para la resolución de ejercicios y

problemas prácticos.

OBJETIVOS ESPECÍFICOS

Fundamentar bibliográficamente el concepto de correlación lineal.

Analizar los conceptos y fórmulas investigadas sobre la correlación

lineal.

Realizar ejercicios para una mejor explicación y comprensión del tema.

JUSTIFICACIÓN

La presente investigación es realizada con la finalidad de hacer

consideraciones respecto a distribuciones bidimensionales o bivariantes,

es decir, el estudio del comportamiento de dos variables, a fin de

determinar si existe alguna relación funcional entre sí, causa y efecto,

además, de cuantificar dicho grado de relación.

Es decir con el estudio de la correlación lineal el estudiante podrá realizar

análisis simultáneos de dos variables bidimensionales como por ejemplo:

producción y consumo; ventas y utilidades; gastos en publicidad y valor en

ventas; salarios altos y horas de trabajo; salarios y productividad; ingresos

y gastos; etc.

Por lo tanto esta investigación será de gran utilidad en la resolución de

problemas del contexto de la carrera de Comercio Exterior.

MARCO TEÓRICO

CORRELACIÓN LINEAL

El análisis de correlación se dirige sobre todo a medir la fuerza de una

relación entre variables. El coeficiente de correlación lineal, r, es la

medida de la fuerza de la relación lineal entre dos variables. La fortaleza

de la relación se determina mediante la magnitud del efecto que cualquier

cambio en una variable ejerce sobre la otra. (JOHNSON, 1990)

EJERCICIOS

1. Dados los siguientes conjuntos de parejas de datos muéstrales:

A B C

X X2 Y Y2 XY X X2 Y Y2 XY X X2 Y Y2 XY

1

4

5

10

13

1

16

25

100

169

1

2

3

4

5

1

4

9

16

25

1

8

15

40

65

4

5

8

9

10

16

25

64

81

100

2

4

5

1

4

4

16

25

1

16

8

20

40

9

40

1

4

7

10

13

1

16

49

100

169

5

4

3

2

1

25

16

9

4

1

5

16

21

20

13

33 311 15 55 129 36 286 16 62 117 35 335 15 55 75

a) Utilice la ecuación para calcular el valor de la r de Pearson para cada

conjunto. Observe que en el conjunto B, donde la correlación es

menor, algunos de los valoresson positivos y otros son negativos.

Estos tienden a cancelarse entre sì, lo cual hace que r tenga una

menor magnitud. Sin embargo, en los conjuntos A y C, todos los

productos tienen el mismo signo, haciendo que la magnitud de r

aumente. Cuando las parejas de datos ocupan las mismas u opuestas

posiciones dentro de sus propias distribuciones, los productos

tienen el mismo signo, lo cual produce una mayor magnitud de r.

b) Calcule r para el conjunto B, utilizando la ecuación para los datos en

bruto. ¿Qué prefiere, utilizar la ecuación de los datos en bruto o la de

los puntajes z?

c) Sume la constante 5 a los datos x en el conjunto A y calcule r de

nuevo, mediante la ecuación de los datos en bruto. ¿Ha cambiado el

valor?

A

X X2 Y Y2 XY

6

9

10

15

18

36

81

100

225

324

1

2

3

4

5

1

4

9

16

25

6

18

30

60

90

58 766

15 55 204

d) Multiplique los datos x del conjunto A por 5 y calcule r de nuevo. ¿Ha

cambiado el valor?

A

X X2 Y Y2 XY

5 20 25 50 65

25 400 625 2500 4225

1 2 3 4 5

1 4 9 16 25

5 40 75 200 325

165 7775 15 55 645

e) Generalice los resultados obtenidos en las partes c y d; restando y

dividiendo los datos entre una constante. ¿Qué le dice esto sobre r?

Que si se suma, resta, multiplica o divide el resultado no varia porque es

una constante.

2.- Un investigador realiza un estudio de la relación entre el consumo de

cigarros y las enfermedades determinan la cantidad de cigarros fumados

continuamente y de días de ausencia en el trabajo durante el último año

debido a una enfermedad para los individuos en la compañía donde

trabaja este investigador. Los datos aparecen en la tabla anexa

Sujeto Cigarro consumidos Días de ausencia

1 0 1

2 0 3

3 0 8

4 10 10

5 13 4

6 20 14

7 27 5

8 35 6

9 35 12

10 44 16

11 53 10

12 60 16

a) Construya una gráfica de dispersión para estos datos. ¿Se ve una

relación lineal?

b) Calcule el valor de la r de Pearson

Sujeto Cigarro

consumidos (X) Días de

ausencia (Y) X

2 Y

2 XY

1 0 1 0 1 0

Si existe una

relación lineal

2 0 3 0 9 0

3 0 8 0 64 0

4 10 10 100 100 100

5 13 4 169 16 52

6 20 14 400 196 280

7 27 5 729 25 135

8 35 6 1225 36 210

9 35 12 1225 144 420

10 44 16 1936 256 704

11 53 10 2809 100 530

12 60 16 3600 256 960

Total 297 105 12193 1203 3391

r= 0,675

c) Elimine los datos de los sujetos 1, 2, 3, 10, 11 y 12. Estos disminuye el

rango de ambas variables. Vuelva a calcular r para los sujetos

restantes. ¿Qué efecto tiene la disminución del rango sobre r?

Sujeto Cigarro

consumidos (X)

Días de ausencia

(Y) X

2 Y

2 XY

4 10 10 100 100 100

5 13 4 169 16 52

6 20 14 400 196 280

7 27 5 729 25 135

8 35 6 1225 36 210

9 35 12 1225 144 420

Total 140 51 3848 517 1197

r= 0,03

Al disminuir el rango; r=0,03 indica que hay una menor relación

entre las variables.

3.- En un largo curso de introducción a la sociología, un profesor hace dos

exámenes. El profesor quiere determinar si las calificaciones de los

estudiantes en el segundo examen están correlacionadas con las

calificaciones del primero. Para facilitarlos, se elige una muestra de ocho

estudiantes cuyas calificaciones aparecen en la siguiente tabla.

Estudiante Examen 1 Examen 2

1

2

3

4

5

6

7

8

60

75

70

72

54

83

80

65

60

100

80

68

73

97

85

90

a) Construya una gráfica de dispersión para datos, utilizando la

calificación del primer examen como la variable X. ¿Parece línea de

correlación?

b) Suponga que existe una relación lineal calificaciones de los dos

exámenes, calcular el valor de la r de Pearson.

X X2 Y Y2 XY

60 3600 60 3600 3600

75 5625 100 10000 7500

70 4900 80 6400 5600

72 5184 68 4624 4896

54 2916 73 5329 3942

83 6889 97 9409 8051

80 6400 85 7225 6800

65 4225 90 8100 5850

∑559 ∑39739 ∑653 ∑54687 ∑46239

c) ¿Qué tan bien explican la relación, las calificaciones del segundo

examen?

0

10

20

30

40

50

60

70

80

90

0 2 4 6 8 10

exa

me

n 1

estudiante

El segundo examen nos explica una mejor relación porque en la

sumatoria nos da un resultado mayor al del primer examen.

4.- Un educador ha construido un examen para las actitudes mecánicas y

desea determinar si este es confiable, mediante dos administraciones con

un lapso de un mes ente ellas. Se realiza un estudio en el cual 10

estudiantes reciben dos administraciones del examen, donde la segunda

administración ocurre un mes después de la primera. Los datos aparecen

en la tabla:

Sujeto Administración 1 Administración 2

1 10 10

2 12 15

3 20 17

4 25 25

5 27 32

6 35 37

7 43 40

8 40 38

9 32 30

10 47 49

a) Construya una gráfica de dispersión para las parejas de datos

b) Determine el valor de r

c) ¿sería justo decir que este es un examen confiable? Explique esto

al utilizar r2

a) Gráfica de Dispersión

Valor de r

(1) X

(2) Y

(3) X

2 (4) Y

2 (5) XY

10 10 100 100 100

12 15 144 225 180

20 17 400 289 340

25 25 625 625 625

27 32 729 1024 864

35 37 1225 1369 1295

43 40 1849 1600 1720

40 38 1600 1444 1520

32 30 1024 900 960

47 49 2209 2401 2303

0

10

20

30

40

50

60

0 10 20 30 40 50

Gráfica de Dispersión

b) Confiabilidad: r2

r2=(0.975)2

r2= 1.95

Examen confiable: valor de r es superior a 1

5.Un grupo de investigadores ha diseñado un cuestionario sobre la

tensión, consistente en quince sucesos. Ellos estos interesados en

determinar si existe una coincidencia entre dos culturas acerca de la

cantidad relativa de ajustes que acarrea cada suceso. El cuestionario se

aplica a 300 estadounidenses y 300 italianos cada individuo debe utilizar

el evento “matrimonio” como estándar y juzgar a los demás eventos en

relación con el ajuste necesario para el matrimonio. El matrimonio recibe

valor arbitraje de 50 puntos, si se considera un evento requiere de más

ajustes que el matrimonio, el evento debe recibir más de 50 puntos .El

número de puntos exentes depende de la cantidad de ajustes requeridos

.Después cada sujeto de cada cultura ha sido asignado puntos a todos los

eventos que se promedian los puntos de cada evento, los resultados

aparecen en la siguiente tabla.

EVENTOS ESTADOS .U ITALIANOS

Muerte de la esposa 100 80

Divorcio 73 95

Separación de la pareja 65 85

Temporada en prisión 63 52

Lesiones personales 53 72

Matrimonio 50 50

Despedido del trabajo 47 40

Jubilación 45 30

Embarazo 40 28

Dificultades sexuales 39 42

Reajustes económicos 39 36

Problemas con la f. Política 29 41

Problemas con el jefe 23 35

Vacaciones 13 16

Navidad 12 10

TOTAL 691 712

a. Suponga que los datos tienen al menos una escala de intervalo y

calcule la correlación entre los datos de los estadounidenses y los

italianos.

EVENTOS ESTADOS .U (X) ITALIANOS (Y) X2 Y2 XY

MUERTE DE LA ESPOSA 100 80 10.000 6.400 8000

DIVORCIO 73 95 5.329 9025 6935

SEPARACION DE LA PAREJA 65 85 4.225 7225 5525

TEMPORADA EN PRISION 63 52 3.969 2704 3276

LESIONES PERSONALES 53 72 2.809 5184 3816

MATRIMONIO 50 50 2.500 2500 2500

DESPEDIDO DEL TRABAJO 47 40 2.209 1600 1880

JUBILACION 45 30 2.025 900 1350

EMBARAZO 40 28 1.600 784 1120

DIFICULTADES SEXUALES 39 42 1.521 1764 1638

REAJUSTES ECONOMICOS 39 36 1.521 1296 1404

PROBLEMAS CON LA F. POLITICA 29 41 841 1681 1189

PROBLEMAS CON EL JEFE 23 35 529 1225 805

VACACIONES 13 16 169 256 208

NAVIDAD 12 10 144 100 120

TOTAL 691 712 39.391 42.644 39766

b. Suponga que los datos solo tienen una escala original y calcule la

correlación de ambas culturas.

INDIVIDUO EX.CON LAPIZ DE PAPEL SIQUIATRIA PSIQUIATRIA

1 48 12 9

2 37 11 12

3 30 4 5

4 45 7 8

5 31 10 11

6 24 8 7

7 28 3 4

8 18 1 1

9 35 9 6

10 15 2 2

11 42 6 10

12 22 5 3

6.- Un psicólogo ha construido un examen lápiz-papel, a fin de medir la

dispersión. Para comparar los datos del examen con los datos de los

expertos, 12 individuos “con perturbaciones emocionales” realizan el

examen lápiz-papel. Los individuos también son calificados de manera

independiente por dos siquiatras, de acuerdo con el grado de depresión

determinado por cada uno como resultado de entrevistas detalladas. Los

datos aparecen a continuación. Los datos mayores corresponden a una

mayor depresión.

Individuo Examen con

lápiz y papel

Siquiatra A Siquiatra B

1

2

3

4

5

6

7

8

9

10

11

12

48

37

30

45

31

24

28

18

35

15

42

22

12

11

4

7

10

8

3

1

9

2

6

5

9

12

5

8

11

7

4

1

6

2

10

3

a) ¿Cuál es la correlación entre los datos de los dos siquiatras?

Siquiatra A (X) Siquiatra B (Y)

12

11

4

7

10

8

3

1

9

2

6

5

9

12

5

8

11

7

4

1

6

2

10

3

144

121

16

49

100

64

9

1

81

4

36

25

81

144

25

64

121

49

16

1

36

4

100

9

108

132

20

56

110

56

12

1

54

4

60

15

b) ¿Cuál es la correlación entre las calificaciones del examen con

lápiz y papel y los datos de cada siquiatra?

Examen con lápiz y papel (X) Siquiatra A (Y)

48 12 2304 144 576

37 11 1369 121 407

30 4 900 16 120

45 7 2025 49 315

31 10 961 100 310

24 8 576 64 192

28 3 784 9 84

18 1 324 1 18

35 9 1225 81 315

15 2 225 4 30

42 6 1764 36 252

22 5 484 25 110

Examen con lápiz y papel (X)

Siquiatra B(Y)

48 9 2304 81 432

37 12 1369 144 444

30 5 900 25 150

45 8 2025 64 360

31 11 961 121 341

24 7 576 49 168

28 4 784 16 112

18 1 324 1 18

35 6 1225 36 210

15 2 225 4 30

42 10 1764 100 420

22 3 484 9 66

7.- Para este problema, suponga que usted es un psicólogo que labora en

el departamento de recursos humanos de una gran corporación. El

presidente de la compañía acaba de hablar con usted acerca de la

importancia de contratar personal productivo en la sección de

manufactura de la empresa y le ha pedido que ayude a mejorar la

capacidad de la institución para hacer esto. Existen 300 empleados en

esta sección y cada obrero fabrica el mismo artículo. Hasta ahora, la

corporación sólo ha recurrido a entrevistas para elegir a estos empleados.

Usted busca bibliografía y descubre dos pruebas de desempeño, lápiz-

papel, bien estandarizadas y piensa que podrían estar relacionados con

los requisitos de desempeño de esta sección. Para determinar si alguna

de ellas se puede utilizar como dispositivo de selección, elige 10

empleados representativos de la sección de manufactura, garantizando

que un amplio rango de desempeño quede representando en la muestra,

y realiza las dos pruebas con cada empleado. Los datos aparecen en la

siguiente tabla.

Mientras mayor sea la calificación, mejor será el desempeño. Las

calificaciones de desempeño en el trabajo son la cantidad real de

artículos fabricados por cada empleado por semana, promediados

durante los últimos 6 meses.

EMPLEADO

1 2 3 4 5 6 7 8 9 10

Desempeño

en el trabajo

Examen 1

Examen 2

50

10

25

74

19

35

62

20

40

90

20

49

98

21

50

52

14

29

68

10

32

80

24

44

88

16

46

76

14

35

a) Construya una grafica de dispersión del desempeño en el trabajo y

la primera prueba, utilizando la prueba 1 como la variable x

¿parece lineal la relación?

0

20

40

60

80

100

120

0 20 40 60

DES

EMP

EÑO

EN

EL

TRA

BA

JO

EXAMEN 1

Desempeño en el trabajo (Y)

Linear (Desempeño en el trabajo (Y))

b) Suponga que la relación anterior es lineal y calcule el valor de la r

de Pearson.

Examen 1 (X)

Desempeño en el trabajo (Y)

10 50 100

361

400

400

441

196

100

576

256

196

2500

5476

3844

8100

9604

2704

4624

6400

7744

5776

500

1406

1240

1800

2058

728

680

1920

1408

1064

19 74

20 62

20 90

21 98

14 52

10 68

24 80

16 88

14 76

c) Construya una grafica de dispersión del desempeño en el trabajo y

la segunda prueba, utilizando la prueba 2 como la variable x.

¿Parece lineal la relación?

d) Suponga que la relación anterior es lineal, calcule el valor de la r

de Pearson.

Examen 2

(X)

Desempeño en el

trabajo (Y)

XY

25 50 625

1225

1600

2500

5476

3844

1250

2590

2480

35 74

40 62

49 90 2401

2500

841

1024

1936

2116

1225

8100

9604

2704

4624

6400

7744

5776

4410

4900

1508

2176

3520

4048

2660

50 98

29 52

32 68

44 80

46 88

35 76

0

20

40

60

80

100

120

0 20 40 60

DES

EMP

EÑO

EN

EL

TRA

BA

JO

EXAMEN 1

Desempeño en el trabajo (Y)

Linear (Desempeño en el trabajo (Y))

e) Si solo pudiera utilizar una de las pruebas para la selección de los

empleados, ¿Utilizaría alguna de ellas? En tal caso, ¿Cuál de

ellas? Explique

La segunda prueba porque tiene una mayor relación entre la

prueba y el desempeño de trabajo.

CONCLUSIONES

El principal objetivo de la correlación lineal es estimar el valor de una

variable dependiente tomando en cuenta el valor de una variable

independiente.

Con el estudio de la correlación lineal se puede resolver casos donde

ya no se utiliza datos unidimensionales, haciendo que el estudiante

pueda realizar análisis a través de las comparaciones de las variables

bidimensionales.

La correlación lineal permite realizar un análisis de las predicciones a

partir de la utilización de datos bivariables.

La correlación también examina la relación entre dos variables pero

restringiendo una de ellas con el objeto de estudiar las variaciones de

una variable cuando una permanece constante.

La correlación permite determinar la dependencia que existe entre dos

variables, es decir si los cambios de la una influyen en los cambios de

la otra.

RECOMENDACIONES

Conocer los valores correctos de las variables independientes para

obtener un valor más real de la variable dependiente.

Realizar análisis correctos con la utilización de variables

bidimensionales que pueden determinar mejores resultados para una

empresa como por ejemplo: ingresos y gastos.

Analizar casos del entorno con datos bivariados para realizar el

respectivo análisis.

Efectuar ejercicios donde el estudiante pueda diferenciar el

comportamiento de una variable ante una variable constante.

Determinar la dependencia de variables que se presentan en el

entorno de comercio exterior para analizar su comportamiento en

relación de la una con la otra.

BIBLIOGRAFÍA

HOWAR B. CHRISTENSEN. (1990). ESTADISTICA PASO A PASO. En

H. B. CHRISTENSEN, ESTADISTICA (págs. 557-590). TRILLAS:

TRILLAS.

JOHNSON, R. (1990). Análisis descriptívo y presentación de datos

bivariados. En ESTADÍSTICA ELEMENTAL (pág. 82 ~ 112). Belmont:

Wadsworth Publishing Company Inc.

Johnson, R. R. ((1990(reimp 2009))). Análisis descriptivo y presentación

de datos bivariados. En Estadística Elemental (Segunda ed., págs. 83 -

112). México, México: Trillas.

CRONOGRAMA DE ACTIVIDADES

MAYO

7 8 9 10 11 14

Asignación del deber X

Investigación x

Realización de ejercicios x X X

Presentación x