Probabilidades y Estadística I
TEMA 2
Medidas características de una distribución de frecuencias
Probabilidades y Estadística I
Esquema inicial
1. Introducción
2. Medidas de Centralización
3. Medidas de Dispersión
4. Medidas de Forma
5. Medidas de Relación
6. Representaciones gráficas. Diagrama de caja
7. Transformaciones de datos
Probabilidades y Estadística I
Esquema inicial
1. Introducción
2. Medidas de Centralización
3. Medidas de Dispersión
4. Medidas de Forma
5. Medidas de Relación
6. Representaciones gráficas. Diagrama de caja
7. Transformaciones de datos
Probabilidades y Estadística I
1. Introducción
OBJETIVO
Resumir las características más importantes de los datos en un conjunto reducido de números.
Centralización Uniformidad
Dispersión Particularidad
Forma Simetrías/concentración
Relación Relación entre variables
C∈
D∈
F ∈
R∈
(1/2)
R
R
R
R
Probabilidades y Estadística I
- Distribución de frecuencias absolutas: { } kiin ,...1=
- Distribución de frecuencias relativas: { } kiif ,...,1= - Distribución de frecuencias absolutas acumuladas: { } kiiN ,...1= - Distribución de frecuencias absolutas relativas: { } kiiF ,...1=
1. Introducción (2/2)
ENUNCIADOS GENERALES
Sea x1, x2, ...., xn un conjunto de n datos
Sea X una variable estadística y sean x1’,x2’,...,xk’ sus modalidades (valores diferentes o marcas de clase).
ó
Datos explícitos
Datos implícitos
Probabilidades y Estadística I
Esquema inicial
1. Introducción
2. Medidas de Centralización
3. Medidas de Dispersión
4. Medidas de Forma
5. Medidas de Relación
6. Representaciones gráficas. Diagrama de caja
7. Transformaciones de datos
Probabilidades y Estadística I
2. Medidas de centralización (1/15)
Una forma de representar de forma sintética (agregada) la información contenida en una serie numérica
Criterio Medida Uso
Repeticiones Moda Medidas nominales
Orden Mediana Medidas ordinales
Valor numérico Media Medidas de intervalo
¿Cuál es el centro de los datos?
Probabilidades y Estadística I
2. Medidas de centralización (2/15)
Moda
2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 Mo= 9
2, 5, 7, 9, 10, 11, 12 Mo no existe
2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 Mo= 4 y 7 (bimodal)
Datos explícitos(idea intuitiva)
Probabilidades y Estadística I
0 1 2 3 40
0,2
0,4
0,6
0,8
1
1,2
Mo
2. Medidas de centralización (3/15)
Datos implícitosModa (idea intuitiva)
Probabilidades y Estadística I
2. Medidas de centralización (4/15)
Moda (definición formal)
Sea X una variable estadística y {x’1,x’2,...,x’k} el conjunto finito de modalidades. Sea {n1,n2,...,nk} su distribución de frecuencias absolutas y {f1,f2,.…,fk} su distribución de frecuencias relativas.
Se dice que x’p es la moda de la serie cuando
np= max {n1,n2,...nk}
fp= max {f1,f2,.…,fk}
Probabilidades y Estadística I
0 1 2 3 40
3
69
12
15
18
2. Medidas de centralización (5/15)
Moda Plurimodalidad
Unimodal
(características)
Probabilidades y Estadística I
2. Medidas de centralización (6/15)
Mediana
Es el valor que deja a cada lado el 50% de los datos en la serie ordenada
3, 4, 5, 6, 8, 8, 10
3, 4, 4, 5, 6, 8, 8, 10
M = 6
M = 5.5
3, 4, 4, 5, 5, 8, 8, 10 M = 5
Datos explícitos(idea intuitiva)
7 datos
8 datos
8 datos
Probabilidades y Estadística I
2. Medidas de centralización (7/15)
MedianaDatos
implícitos
5 6 7 8 94
0.2
0.4
0.6
0.8
1
0.5
M
(idea intuitiva)
Probabilidades y Estadística I
2. Medidas de centralización (8/15)
Mediana (definición formal)
Sea x1, x2, ...., xn una serie de datos y sea x(1) ≤ x(2) ....≤ x(k) la serie ordenadade menor a mayor.
( )
( ) ( )
j
j j+1
n +1x si j2Mn +1si j < j 1
2 2
== + < +
x x
Sea X una variable estadística y F(x) su función acumulativa de frecuencias relativas. Se define la mediana como la solución de la siguiente ecuación funcional
F(x) = ½
Datos explícitos
Datos implícitos
Probabilidades y Estadística I
2. Medidas de centralización (9/15)
Mediana (características)
Es poco sensible a asimetrías
MM
Probabilidades y Estadística I
2. Medidas de centralización (10/15)
Mediana (características)
Es insensible a valores atípicos
M M
Probabilidades y Estadística I
2. Medidas de centralización (11/15)
Media aritmética (idea intuitiva)
Centro de gravedad de los datos
Probabilidades y Estadística I
2. Medidas de centralización (12/15)
Media aritmética (definición)
1 2 nx x .... x n
+ + +
Datos explícitos
∑∑
=
===k
i
k
iii
ii n
xnxfX
1
1'
'Datos
implícitos
Probabilidades y Estadística I
2. Medidas de centralización (13/15)
Media aritmética (características)
Cuanto más asimétrica sea más se desplaza la media hacia la cola
Probabilidades y Estadística I
2. Medidas de centralización (14/15)
Media aritmética (características)
Es muy sensible a valores atípicos
Probabilidades y Estadística I
2. Medidas de centralización (15/15)
Media aritmética (características)
Es un operador lineal (equivale a la regla de tres)
a X bY a X bY+ = +
Probabilidades y Estadística I
Esquema inicial
1. Introducción
2. Medidas de Centralización
3. Medidas de Dispersión
4. Medidas de Forma
5. Medidas de Relación
6. Representaciones gráficas. Diagrama de caja
7. Transformaciones de datos
Probabilidades y Estadística I
3. Medidas de dispersión (1/11)
MOTIVACIÓN
Probabilidades y Estadística I
3. Medidas de dispersión (2/11)
Una forma de representar cuánto discrepan los valores de una serie de datos
Distancia media a la media
Varianza/Desviación típica Medidas de intervalo
Orden Cuartiles/Percentiles Medidas ordinales
Discrepancia Rango Medidas nominales
¿cuánto se alejan de lo uniforme los valores de una serie ?
Criterio Medida Uso
Probabilidades y Estadística I
3. Medidas de dispersión (3/11)
Rango (idea intuitiva)
Rango 1 Rango 2
Probabilidades y Estadística I
3. Medidas de dispersión (4/11)
Rango (definición formal)
Sea X una variable estadística y {x’1,x’2,...,x’k} el conjunto finito de modalidades. Sea {n1,n2,...,nk} su distribución de frecuencias absolutas y {f1,f2,.…,fk} su distribución de frecuencias relativas.
Rg X = Max X − Min X = x’k − x’1