Estadistica
-
Upload
norma-huaman -
Category
Education
-
view
1.323 -
download
0
description
Transcript of Estadistica
Estadística
Es aquella disciplina que se encarga de la recopilación , clasificación, presentación y descripción de unidades de información denominadas datos para una adecuada toma de decisiones.
Población es el conjunto de elementos sobre los cuales se va a estudiar una determinada característica.
Muestra es una parte de la población.
Variable estadística: el aspecto que se va a estudiar. Si se puede medir se llama variable cuantitativa si no se pueden medir se llama variable cualitativa.Si la variable estadística toma un número determinado de valores se llama variable discreta.Si la variable estadística puede tomar cualquier valor entre dos valores dados se llama variable continua.
Valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico.
Conceptos
RECOGIDA DE DATOS :Planteado el test o encuesta oportuno , una vez elegido el tema al que se quiere hacer el estudio estadístico, y recogidos los datos que correspondan, el primer análisis que realizaremos es el del tipo de variable que pretendemos estudiar (Cualitativa o Cuantitativa; Discreta o Continua). Esto condicionará en gran medida su posterior tratamiento.
PASO 1:
Recuento
PASO 2:CLASIFICACIÓN DE LOS DATOS :Determinado el modo de agrupamiento de las observaciones, procedemos a su recuento,construyendo la tabla de frecuencias. Posteriormente podremos visualizar tales frecuencias de forma gráfica con el diagrama estadístico apropiado.
a) TABLA DE FRECUENCIASb) GRÁFICOS: diagrama de barras, histograma,
polígono de frecuencias, diagrama de sectores, pictogramas, pirámides de población, climogramas, etc.
DATOSxi
Frecuencia absoluta
fi
Frecuencia absoluta
acumulada Fi
Frecuencia relativaFrecuencia relativa
acumulada
Decimal PorcentualDecimal
Hi
Porcentual%Ai
5 6 6 0,0150 1,5 % 0,0150 1,5 %
6 48 54 0,1200 12 % 0,1350 13,5 %
7 95 149 0,2375 23,75 % 0, 3725 37,25 %
8 105 254 0,2625 26,25 % 0,6350 63,50 %
9 87 341 0,2175 21,75 % 0,8525 85,25 %
10 59 400 0,1475 14,75 % 1 100 %
N = 400 1 100 %
ii
fh = N i i% =100×h
Tabla de frecuencias con variable cuantitativa discreta
Se a encuestado a un grupo de personas, queriendo conocer el numero de habitantes en su vivienda.
xi fi Fi hi Hi %i %Ai
[0, 5) 2.5 1 1 0.025 0.025 2.5 2.5[5, 10) 7.5 1 2 0.025 0.050 2.5 5
[10, 15) 12.5 3 5 0.075 0.125 7.5 12.5[15, 20) 17.5 3 8 0.075 0.200 7.5 20[20, 25) 22.5 3 11 0.075 0.2775 7.5 27.5[25, 30) 27.5 6 17 0.150 0.425 15 42.5[30, 35) 32.5 7 24 0.175 0.600 17.5 60[35, 40) 37.5 10 34 0.250 0.850 25 85[40, 45) 42.5 4 38 0.100 0.950 10 95[45, 50) 47.5 2 40 0.050 1 5 100
N = 40 1 100
Tabla de frecuencias con variable cuantitativa continuaSe le pregunta a un grupo de personas, sobre los días que demora para termina de leer una obra literaria.
1 5 2 5 0 6 1 2 3 4
4 3 3 1 4 3 7 4 6 5
4 0 6 2 3 8 0 2 7 3
2 5 7 3 4 7 5 10 1 8
3 6 0 5 9 1 2 8 2 9
Cuando la cantidad de datos recopilados sea muy grande es conveniente condensarlos en grupos denominados clases pero, evitando perder demasiados detalles. Se elaboran tablas de distribución de frecuencias a partir de los siguientes elementos.
Tamaño ( n ) .- Es la cantidad de datos recogidosEn el ejemplo n = Alcance ( A ) .- Es el intervalo cerrado que tiene por limites a los datos de menor y mayor valorEn el ejemplo A = [ ] Rango ( R ) .- O amplitud , es la longitud del alcanceEn el ejemplo : R = l ( A ) = Número de clases ( K ).- Es la cantidad de grupos e intervalos y depende del criterio del estadístico , aunque es usual utilizar como un primer valor aproximado el obteniendo por la regla de sturges. K = 1 + 3 .3log (n)En el ejemplo K = 1 +3.3log ( ) Ancho de clase ( Wi ).- Es la longitud de una clase. Si se desea anchos de clase iguales se puede utilizar la siguiente relación: W = R/kEn el ejemplo W = / Frecuencia absoluta ( fi ).- Es la cantidad de datos que caen dentro de un clase .En el ejemplo
Int / clase Conteo Frec. Absoluta
( Fi ) ( fi )
[ , >
[ , >
[ , >
[ , >
[ , ]
3ra Etapa : Presentación En esta etapa, se elaboran tablas y gráficos más completos , a partir de los siguientes elementos adicionales. Frecuencia relativa ( hi ) .- Es la comparación establecida entre la frecuencia absoluta y el tamaño de la muestra hi = /Frecuencia absoluta acumulada ( Fi ) .- Es la suma de la frecuencia absoluta correspondiente a una clase con todas las precedentes.Frecuencia relativa acumulada ( Hi ) .- Es la suma de la frecuencia relativa a una clase como todas las precedentes.Marca de clase ( xi ) .- Es un valor representativo de una clase .Se calcula como la media aritmética de los limites del intervalo
MARCA DE CLASE
FRECUENCIA ABSOLUTA
FRECUENCIA RELATIVA
FRECUENCIA ABSOLUTA ACUMULADA
FRECUENCIA RELATIVA ACUMULADA
FRECUENCIA RELATIVA PORCENTUAL
li xi fi hi Fi Hi ( % ) xifi[ , > [ , > [ , > [ , > [ , ]
LAS GRÁFICAS ESTADÍSTICAS PERMITEN VISUALIZAR LA INFORMACIÓNCONTENIDA EN LAS TABLAS DE MANERA RÁPIDA Y SENCILLA
EXISTEN MUCHOS TIPOS DE GRÁFICAS ESTADÍSTICAS, UNAS SE EMPLEAN CON VARIABLES CUANTITATIVASY OTRAS CON VARIABLES CUALITATIVASDIAGRAMA DE BARRAS HISTOGRAMA
GRÁFICAS ESTADÍSTICAS
Diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto.Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas, relativas, porcentajes o frecuencias acumuladas. Los datos se representan mediante barras de una altura proporcional a la frecuencia.
Grupo sanguíneo fi
A 6
B 4
AB 1
0 9
N = 20
A B AB O0123456789
10
Grupo sanguíneofi
Histograma se utiliza para de presentar datos cuantitativos de tipo continuo.Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los intervalos de los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas, relativas , porcentajes o frecuencias acumuladas. Los datos se representan mediante barras pegadas unas a otras de una altura proporcional a la frecuencia.
Puntuación Marca de clase xi
fi
11-17 14 6
18-24 21 4
25-31 28 15
32-38 35 13
39-45 42 1
46-52 49 1
N = 40
Polígono de frecuencias se realiza para cualquier tipo de variable. Es el polígono que se forma al unir los puntos medios de las barras tanto en histogramas como en diagramas de barras.
Diagrama de sectores es un gráfico donde se suele representar los porcentajes. Cada sector es proporcional al porcentaje que representa. Los grados de cada sector es:
igrados =360×h
9%
21%
19%15%
15%
15%6%
Población de la encuesta por edad
12 Años
13 Años
14 Años
15 Años
16 Años
17 Años
18 Años
Pictograma es un gráfico con figuras
Pirámide de población consiste en dos histogramas, uno para hombres y otro para mujeres, correspondientes a habitantes de una misma comunidad más o menos extensa, repartidos por edades.Es útil para estudiar su situación demográfica y buscar explicaciones a situaciones presentes , pasadas y futuras.
Climograma son gráficas que representan la distribución de precipitaciones y temperaturas a largo de un año en un lugar determinado.
ANÁLISIS DE DATOS: Para este análisis se utilizan los parámetros estadísticos:
a) Medidas de centralizaciónMEDIA, MEDIANA y MODA
b) Medidas de dispersiónRECORRIDO, DESVIACIÓN MEDIA,….
c) Medidas de posiciónPERCENTILES y CUARTILES
MEDIA ARITMÉTICA es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:
Evidentemente esta medida sólo se puede hallar para variables cuantitativas.
Medidas de dispersiónRECORRIDO, DESVIACIÓN MEDIA,….
xi fi xi · fi
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60) 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1 820
Ejemplo de cálculo de media:
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuación media
MODA es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar para cualquier tipo de variable, aunque para variables cuantitativas es poco útil.
La moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 es Mo= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
MEDIANA es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar sólo para variables cuantitativas.
Cálculo de la mediana con pocos datos
1. Ordenamos los datos de menor a mayor.
2. Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5
3. Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.
7, 8, 9, 10, 11, 12 Me= 9.5
fi Fi
[60, 63) 5 5
[63, 66) 18 23
[66, 69) 42 65
[69, 72) 27 92
[72, 75) 8 100
100
Cálculo de la mediana para datos agrupados
Se divide N entre dos para ver dónde está el centro
100/2 = 50
Se busca en la columna de Fi
dónde estaría 50.Luego el valor o intervalo mediano será:
Clase de la mediana: [66, 69)
RELACIÓN ENTRE MEDIA Y MEDIANA
a) Si , la distribución es completamente simétrica
b) Si los valores de y son próximos, la distribución es aproximadamente simétrica
c) Si los valores de y son poco próximos, la distribución es asimétrica
ex =M
x eM
x eM
1 2 3 4 5 6 7 8 9 100
1
2
3
4
5
Notas del control Grupo B
1 2 3 4 5 6 7 8 9 100
1
2
3
4
5
Notas del control Grupo A
ACTIVIDAD 1a) A partir de las siguientes gráficas realiza la tabla de frecuencias y calcula
MEDIA, MEDIANA y MODA de cada una de las distribuciones.b) Indica tipo de variable y tipo de gráfico en cada caso.c) Indica cómo es simétricamente cada una de ellas.
10%
23%
30%
15%
23%Espaguetis
Cocido
Lentejas
Gazpacho
Paella
ACTIVIDAD 2En el comedor de un instituto se da a elegir a su alumnado entre varios primeros platos. El resultado de las distintas elecciones nos lo da el siguiente gráfico.
a) Indica tipo de variable, y tipo de gráfica.b) Sabiendo que se le ha preguntado a 240 personas, realiza la tablade frecuencias y calcula las medidas de centralización que mássentido tengan.
Medidas de dispersiónRECORRIDO, DESVIACIÓN MEDIA,….
Recorrido es la diferencia entre los valores extremos, es decir, entre el mayor valor y el menor
RECORRIDO = Valor mayor - Menor valor
Desviación Media es un parámetro asociado a la media; y es el promedio ( o media) de las distancias de los valores de todos los individuos a la media.
suma de las distancias a xDM= N