Estadistica Descriptiva e Inferencial

29
Republica Bolivariana de Venezuela Ministerio del Poder Popular para la Educación Universitaria Universidad Nacional Experimental de Los Llanos Occidentales Ezequiel Zamora Núcleo El Recreo - Estado Apure Estadística y Probabilidades Conceptos y definiciones básicas Profesora: Bachilleres: González Eurys C.I. 20.004.688 Trejo José C.I.

Transcript of Estadistica Descriptiva e Inferencial

Page 1: Estadistica Descriptiva e Inferencial

Profesora: Bachilleres: González Eurys C.I. 20.004.688

Trejo José C.I.

Estadística y ProbabilidadesConceptos y definiciones básicas

Republica Bolivariana de Venezuela Ministerio del Poder Popular para la Educación Universitaria

Universidad Nacional Experimental de Los Llanos Occidentales Ezequiel Zamora Núcleo El Recreo - Estado Apure

Page 2: Estadistica Descriptiva e Inferencial
Page 3: Estadistica Descriptiva e Inferencial

INTRODUCCIÓN

La Estadística actual es el resultado de la unión de dos disciplinas que evolucionan de manera independiente hasta confluir en el siglo XIX: el Cálculo de Probabilidades, que nace en el siglo XVII como teoría matemática de los juegos de azar, y la Estadística, ciencia del estado, que estudia la recogida y descripción de datos y que es de raíces bastante más antiguas. Esto hace que una de las acepciones más aceptadas de Estadística sea la que la define como el conjunto de métodos que tiene por objeto la obtención, tratamiento y la interpretación de un conjunto de datos de observación relativos a un grupo de individuos o unidades. La Estadística actúa como disciplina puente entre los modelos matemáticos y los fenómenos reales.

Es difícil establecer una cronología exacta de los orígenes de la Estadística. Desde la antigüedad, los estados han recogido información sobre la población y riquezas que existía en sus dominios (censos, inventarios…). Por otra parte, desde el siglo XVII se ha tratado de interpretar fenómenos biológicos y sociales de poblaciones a partir de datos numéricos (tablas de mortalidad, contrastación de la teoría de Darwin, estudio de la herencia humana…) mediante procesos deductivos (Estadística Descriptiva).

Desde finales del siglo XIX, aplicando métodos inductivos (Estadística Inferencial), la Estadística ha visto ampliado su campo de aplicación a prácticamente todos los sectores (Ingeniería, Física,Medicina,…). Así, la Estadística se ocupa de la descripción de datos (procedimientos para resumir la información), del análisis de muestras (elegir muestras representativas y hacer inferencia), de la contrastación de hipótesis (comparar predicciones con datos observados), de la medición de relaciones (relación estadística), de la predicción (mediante el estudio del historial de las variables), etc.

El método científico se basa en dos tipos de razonamientos: el deductivo (de lo general a lo particular) y el inductivo (de lo particular a lo general). Ambos tipos de razonamientos darán lugar respectivamente a la Estadística Descriptiva y a la Inferencial.

Page 4: Estadistica Descriptiva e Inferencial

1. ESTADÍSTICA DESCRIPTIVA

La Estadística Descriptiva o Deductiva trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones. Se construyen tablas y se representan gráficos que permiten simplificar la complejidad de los datos que intervienen en la distribución. Asimismo, se calculan parámetros estadísticos que caracterizan la distribución. No se hace uso del Cálculo de Probabilidades y únicamente se limita a realizar deducciones directamente a partir de los datos y parámetros obtenidos.

Elementos

El primer paso en toda investigación estadística consiste en fijar el conjunto de elementos que queremos estudiar, que llamaremos población o universo. Cada elemento de la población se denomina individuo o unidad estadística. La población puede ser el conjunto de personas de una localidad, las llamadas telefónicas a una central… Llamaremos muestra a un subconjunto limitado extraído de la población, con objeto de reducir el número de experiencias.

Una vez fijada la población debemos indicar cuáles son las características o cualidades que nos interesan estudiar en esa población, estableciendo la forma en la que deben medirse, las unidades de medida…

Estas características observables en una población se clasifican en cualitativas, que son aquellas que no se pueden cuantificar, tales como el color de pelo, el gusto musical, grupo sanguíneo,… Las características que no son cualitativas las llamamos cuantitativas, que son aquellas que sí se pueden cuantificar, como es la estatura, el número de hijos…

A su vez, las características cuantitativas se dividen en dos tipos, las discretas y las continuas. Las características cuantitativas discretas son aquellas que toman valores aislados, como es el número de televisores en una unidad familiar o el número de hijos de una pareja. Por el contrario, las variables continuas pueden tomar cualquier valor comprendido en un determinado rango o intervalo, aunque muchas veces la unidad de medida no nos permita tal hecho. Esto ocurre, por ejemplo, al estudiar la altura de una población, que aunque sabemos que es una variable continua, los aparatos de medida sólo nos permiten tomar éstas con una determinada aproximación.

Algunas veces también es preferible, en el caso de las variables discretas con un gran número de resultados, tratarlas como si fueran variables continuas y viceversa.

Una vez obtenida la información referente a la variable de estudio, ésta se organiza y resume en las llamadas distribuciones de frecuencias, que nos

Page 5: Estadistica Descriptiva e Inferencial

proporcionan el número de individuos que hay para cada uno de los valores de la variable. Estas distribuciones de frecuencias pueden ser de frecuencias absolutas, que nos dicen el número de individuos que presentan un determinado valor de la variable, o de frecuencias relativas, que nos dan el tanto por uno o por ciento de la población que presenta es determinado carácter. En ocasiones, también serán de utilidad las frecuencias acumuladas, en las que cada valor acumula los datos pertenecientes también a los que son menores que él.

Medidas

Uno de los objetivos de la Estadística Descriptiva es la de resumir toda la información recopilada en unos pocos valores numéricos, para poder sacar consecuencias de esa información. Dentro del conjunto de valores numéricos que resumen toda la información los hay de distinto tipo y que aportan distintas características.

Así, nos encontramos con:-Medidas de centralización: media, moda, mediana, cuarteles, deciles y percentiles…-Medidas de dispersión: varianza, desviación típica, rango, rango intercuartílico…-Medidas de forma: coeficiente de variación de Pearson, Curtosis de Fisher…-Relación entre variables: coeficiente de correlación lineal, recta de regresión…

Gráficos

Dentro de las técnicas que permiten resumir la información de una variable estadística, los gráficos ocupan un papel fundamental, debido a su facilidad de comprensión incluso entre aquellas personas que no poseen conocimientos de estadística.

Los diagramas de barras, pictogramas, diagramas de sectores, histogramas, polígonos de frecuencias, diagramas de caja y bigotes, pirámides de población, cartogramas, entre otras, ofrecen una información visual muy clara para comprender cómo está distribuida la característica que estamos estudiando en la población. La introducción del ordenador ha permitido que estos gráficos se obtengan de forma sencilla y rápida con una gran calidad gráfica.

Page 6: Estadistica Descriptiva e Inferencial

ESTADISTICA INFERENCIAL

El arte de obtener con confianza conclusiones sobre el modo de proceder del fenómeno que se estudia es el objeto de las diversas técnicas existentes de Inferencia Estadística. La Estadística Inferencial o inductiva plantea y resuelve el problema de establecer previsiones y conclusiones generales sobre una población a partir de los resultados obtenidos de una muestra. Los modelos estadísticos actúan de puente entre lo observado (muestra) y lo desconocido (población). Su construcción y estudio están basados en el Cálculo de Probabilidades.Así pues, la Inferencia Estadística es la metodología tendente a hacer descripciones, predicciones, comparaciones y generalizaciones de una población estadística a partir de la información contenida en una muestra. Utiliza resultados obtenidos mediante la Estadística Descriptiva y se apoya fuertemente en el Cálculo de Probabilidades.

Clasificación de los procedimientos de Inferencia Estadística

Los procedimientos de Inferencia Estadística los podemos clasificar atendiendo a tres criterios:

A. Respecto al objetivo de estudio. Si el objetivo es describir una variable o las relaciones entre un conjunto de variables se utilizan técnicas de muestreo. Cuando el objetivo es contrastar relaciones entre las variables y predecir sus valores futuros se utilizan técnicas de diseño experimental.

B. Respecto al método utilizado, nos encontramos con los métodos paramétricos y los no paramétricos. Los métodos paramétricos suponen que los datos provienen de una distribución que puede caracterizarse por un pequeño número de parámetros que se estiman a partir de los datos. Los métodos no paramétricos suponen únicamente aspectos muy generales de la distribución y tratan de estimar su forma o contrastar su estructura.

C. Respecto a la información considerada. Aquí distinguimos el enfoque clásico y el enfoque bayesiano. El enfoque clásico supone que los parámetros son cantidades fijas desconocidas sobre las que no se dispone de información inicial relevante. Por el contrario, el enfoque bayesiano considera a los parámetros del modelo como variables aleatorias y permite introducir información inicial sobre sus valores mediante una distribución de probabilidades a priori. La base en que se fundamenta la Estadística Inferencial es el Cálculo de Probabilidades.

Page 7: Estadistica Descriptiva e Inferencial

TÉCNICAS DE MUESTREO, ENCUESTAS Y CENSOS

Muestreo

Cuando una investigación estadística se realiza a toda la población decimos que estamos realizando un censo (Estadística Descriptiva), pero si recogemos datos de información relativos sólo a una muestra diremos que estamos realizando una encuesta o sondeo (término utilizado fundamentalmente cuando la población de estudio la constituyen personas).El muestreo es el primer paso en el proceso de inferencia estadística y se acude a él por resultar más rápido, y económico, o porque se usan procedimientos destructivos, o por necesidad de pruebas testigos, etc.

Existen los siguientes tipos de elección de muestras:

Muestreo aleatorio. Consiste en listar todos los elementos de la población y seleccionar aleatoriamente n elementos de la

Muestreo sistemático. Consiste en seleccionar los n elementos de la muestra de k en k, siendo k el entero más próximo a n N Tamaño de la muestra

Número de elementos de la población , y partiendo de un arranque aleatorio i, comprendido entre 1 y k. Muestreo por estratos. Consiste en dividir la población en estratos homogéneos y en cada uno de ellos tomar muestras aleatorias simples.

Muestreo por conglomerados. Consiste en dividir la población en conglomerados. Se eligen al azar unos pocos de estos conglomerados y la muestra estará formada por todos los elementos de ellos o por muestras aleatorias simples de éstos.

Muestreo anidado. Es una generalización del muestreo por conglomerados. En la primera etapa se seleccionan una serie de conglomerados o unidades muéstrales primarias, en una segunda se seleccionan conglomerados más pequeños, pertenecientes a los anteriores, llamados unidades muéstrales secundarias, y así sucesivamente cuantas etapas sean necesarias.

Encuestas

La realización de una encuesta consta de varias etapas desde que se concibe hasta que se culmina.Estas etapas, según William Cochran, son las siguientes:

1. Indicar los objetivos de la encuesta.Deben expresarse con la mayor precisión posible para obtener resultados que concuerden con los objetivos inicialmente planteados.

2. Definición de la población sobre la que se va a realizar la encuesta. Debe tenerse un criterio que defina por comprensión a la población.

3. Determinación de las preguntas a efectuar.

Page 8: Estadistica Descriptiva e Inferencial

El número de preguntas debe ser el menor posible y ha de estar en consonancia con el interés de los datos que se desean obtener. Deben ser de fácil comprensión y carentes de ambigüedad.

4. Expresión del grado de precisión que se desea.

Como en todo estudio estadístico, ha de decidirse a priori el grado de precisión deseado.

5. Métodos de medición.

Las formas de registrar las preguntas y respuestas pueden permitir codificar estas últimas y simplificar el tratamiento posterior de los resultados.

6. Elección de las unidades de muestreo.

Antes de seleccionar la muestra, la población debe ser dividida en unidades de muestreo que son clases de una clasificación de la población. Al conjunto de las unidades e informaciones de que disponemos para realizar la encuesta se la denomina marco de la encuesta.

7. Estratificación de la población.

La estratificación puede ser uniforme, cuando el tamaño de la muestra es el mismo para todos los estratos, proporcional, si el tamaño de la muestra en cada estrato es proporcional al número de elementos del estrato, y óptima, cuando se relaciona el tamaño de la muestra de cada estrato con la concentración de los elementos del estrato respecto a un valor medio de la población.

8. Selección de la muestra.Para cada elección de método de selección de la muestra se pueden hacer estimaciones acerca del tamaño de la muestra, una vez prefijado el nivel de precisión a emplear. El tamaño de la muestra condicionará el tipo de muestreo que hemos de utilizar.

9. Encuesta piloto.

Es conveniente probar la encuesta a pequeña escala. De esta forma puede conseguirse una aproximación al costo real que va a suponer la encuesta.

10. Organización del trabajo de campo.

Han de limitarse las características espacio-temporales del trabajo del encuestador.

11. Tabulación y análisis de datos.

Una vez recogidos los datos, han de depurarse los cuestionarios obtenidos, así como codificar las respuestas si es posible. Igualmente habrán de hacerse valoraciones acerca de las respuestas desestimadas.

Page 9: Estadistica Descriptiva e Inferencial

12. Información para futuras encuestas.

La información obtenida permitirá determinar el tamaño de la muestra para futuras encuestas de modo que se consigan resultados óptimos y una mayor rapidez en la obtención de resultados.Una vez vistas las etapas de las que consta una encuesta, veamos ahora los elementos básicos de la misma. Entre ellos nos encontramos con:

La información que se desea recibir y con qué precisión. A qué población va dirigida y qué muestra va a ser seleccionada. El método elegido para llevarla a cabo. La forma de elaborarla para que el análisis posterior sea válido y fácil de

realizar. Indicar si es ocasional, repetida o continua.

Censos

Lo que se denomina censo es una operación estadística, a gran escala, en la que se trata de investigar el 100 % de los objetos susceptibles de estudio. Habitualmente, los censos que se realizan corresponden a personas, viviendas, edificios, etc.Aunque pueden pensarse que el censo es la mejor manera de estudiar las características de una población, éste plantea una serie de inconvenientes, entre los que se encuentran:

El coste que conlleva su ejecución. El tiempo que se necesita para su realización. La aparición de errores intrínsecos a la naturaleza de las operaciones a

gran escala.

Trataremos a continuación el tercer inconveniente.La aparición de errores intrínsecos proviene principalmente de la recogida de datos y el proceso de información. Podemos distinguir entre errores de cobertura y errores de contenido.El error de cobertura es el error en la enumeración de las personas o viviendas provocado por omisiones durante el recorrido censal, error por subenumeración o subcobertura censal; o bien por inclusiones erróneas en el censo, error de superenumeración o supercobertura. Estos errores suelen ser debidos a operaciones de campo defectuosas, falta de cuidado por los agentes enumeradores, falta de cooperación por parte de los respondientes o simplemente porque se extravían los cuestionarios o son destruidos durante la operación censal.El error de contenido se define como el error en las características investigadas en el censo en aquellas unidades que fueron correctamente incluidas en el censo. Estos errores se producen por falta de respuesta, respuesta errónea o inconsistente en determinados ítems contenidos en el cuestionario, errores en la interpretación de las preguntas y errores en las codificaciones y proceso de datos.Dado que el objetivo fundamental de un censo es el recuento exhaustivo de toda la población, los errores de cobertura adquieren especial relevancia.Los instrumentos de medida de estos errores difieren fundamentalmente del nivel de sofisticación técnica y en los requerimientos de la información adicional al censo. Si sólo disponemos de la información que proporciona el propio censo, las

Page 10: Estadistica Descriptiva e Inferencial

posibilidades de evaluación son bastante limitadas y están circunscritas a la realización de análisis demográficos y sólo sirven para proporcionar indicadores de posibles errores; por ejemplo, la falta de población indica errores de cobertura. Otras posibilidades pasan por el cálculo de índices sensibles a estos errores, como puede ser el número de personas por hogar y su distribución por áreas geográficas; también pueden utilizarse ratios y distribuciones censales, por ejemplo, la proporción de personas censadas por edad y sexo, o el número de niños nacidos según la edad de la madre, estos ratios deben proporcionar series de progresión suave, cualquier salto brusco puede indicar un error.Si disponemos de fuentes ajenas al propio censo se pueden realizar análisis más sofisticados. Si disponemos de la población en un censo anterior, podemos elaborar, a partir de tasas de intercambio durante el periodo intercensal, una “población esperada” que nos sirva de referencia para la que obtengamos; a partir del dato del censo anterior, la suma algebraica de nacimientos y defunciones, inmigrantes y emigrantes, obtenemos esa estimación. Como es obvio, la bondad de la estimación depende de la fiabilidad de los registros utilizados.También pueden construirse modelos matemáticos de proyecciones de población utilizando los niveles y tendencias de fertilidad, mortalidad y migración en el periodo intercensal; para estimar esos niveles y tendencias se deben utilizar registros ajenos al censo, como pueden ser determinados registros administrativos y diferentes encuestas demográficas.Por otro lado, las encuestas demográficas pueden ser utilizadas para evaluar determinadas características de la población recogidos en el censo, bajo la hipótesis de que los errores ajenos al muestreo afectan a los datos de una encuesta son muy inferiores a los que afectan a un censo.Por último, otro de los instrumentos más utilizados para evaluar la calidad de un censo son las llamadasEncuestas de Post-enumeración censal o Encuestas de Evaluación, que consisten en repetir el propio censo en una muestra o áreas que son recorridas exhaustivamente poco tiempo después de realizado el censo por agentes especialmente adiestrados. Estos agentes contrastan la enumeración obtenida enel censo con el existente en la realidad, prestando especial atención a las omisiones e inclusiones erróneas de unidades censales.

Como hemos visto, los censos pueden ser evaluados a partir de encuestas pero éstos a su vezproporcionas a las investigaciones por muestreo:- Información indispensable para la construcción de las bases de muestreo.- Información auxiliar para ser utilizada en:o Procesos de estratificación.o Procesos de estimación

CONCLUSIÓNLa Estadística puede definirse como el conjunto de métodos que tiene por objeto la obtención, el tratamiento y la interpretación de un conjunto de datos de observación relativos a un grupo de individuos o unidades.

Page 11: Estadistica Descriptiva e Inferencial

Dentro de la Estadística pueden considerarse dos grandes ramas: la Estadística Descriptiva, que trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones y mediciones, y laEstadística Inferencial que, haciendo uso del Cálculo de Probabilidades, describe, predice, compara y generaliza resultados a una población estadística a partir de la información que obtiene de una parte dela población.

Tipos de variables

Variable independiente

Una variable independiente es aquella cuyo valor no depende del de otra variable.

La variable independiente en una función se suele representar por x.

La variable independiente se representa en el eje de abscisas.

Variable dependiente

Una variable dependiente es aquella cuyos valores dependen de los que tomen otra variable.

La variable dependiente en una función se suele representar por y.

La variable dependiente se representa en el eje ordenadas.

La variable y está en función de la variable x.

Variables estadísticas

Variable cualitativa

Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos:

Variable cualitativa nominal

Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden. Por ejemplo:

El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

Page 12: Estadistica Descriptiva e Inferencial

Variable cualitativa ordinal o variable cuasicuantitativa

Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe un orden. Por ejemplo:

La nota en un examen: suspenso, aprobado, notable, sobresaliente.

Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...

Medallas de una prueba deportiva: oro, plata, bronce.

Variable cuantitativa

Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:

Variable discreta

Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. Por ejemplo:

El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continúa

Una variable continua es aquella que puede tomar valores comprendidos entre dos números. Por ejemplo:

La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.

En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales.

Variable aleatoria

Se llama variable aleatoria a toda función que asocia a cada elemento del espacio muestral E un número real.

Se utilizan letras mayúsculas X, Y, ... para designar variables aleatorias, y las respectivas minúsculas (x, y, ...) para designar valores concretos de las mismas.

Variable aleatoria discreta

Una variable aleatoria discreta es aquella que sólo puede tomar valores enteros.

Ejemplos

Page 13: Estadistica Descriptiva e Inferencial

El número de hijos de una familia, la puntuación obtenida al lanzar un dado.

Variable aleatoria continua

Una variable aleatoria continua es aquella que puede tomar todos los valores posibles dentro de un cierto intervalo de la recta real.

Ejemplos

La altura de los alumnos de una clase, las horas de duración de una pila.

Variable aleatoria binomial

La variable aleatoria binomial, X, expresa el número de éxitos obtenidos en cada prueba del experimento.

La variable binomial es una variable aleatoria discreta, sólo puede tomar los valores 0, 1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas.

Ejemplo

k = 6, al lanzar una moneda 10 veces y obtener 6 caras.

Variable aleatoria normal

Una variable aleatoria continua, X, sigue una distribución normal de media μ y desviación típica σ, y se designa por N(μ, σ), si se cumplen las siguientes condiciones:

1. La variable puede tomar cualquier valor: (-∞, +∞ )

2. La función de densidad, es la expresión en términos de ecuación matemática de la curva de Gauss.

Variable estadística bidimensional

Una variable bidimensional es una variable en la que cada individuo está definido por un par de caracteres, (X, Y).

Estos dos caracteres son a su vez variables estadísticas en las que sí existe relación entre ellas, una de las dos variables es la variable independiente y la otra variable dependiente.

ESCALAS DE MEDICIÓN

Page 14: Estadistica Descriptiva e Inferencial

Todo problema de investigación científica, aún el más abstracto, implica de algún modo una tarea de medición de los conceptos que intervienen en el mismo. Porque si tratamos con objetos como una especie vegetal o un comportamiento humano nos veremos obligados ya sea a describir sus características o a relacionarse éstas con otras con las que pueden estar conectadas: en todo caso tendremos que utilizar determinadas variables –tamaño, tipo de flor, semilla, o las variables que definan el comportamiento de estudio- y tendremos que encontrar el valor que éstas asumen en el caso estudiado. En eso consiste, desde el punto de vista lógico más general, la tares de medir.

La idea de medición, de medida, es intrínsecamente comparativa. Medir algo, en el caso más sencillo, es determinar cuantas veces una cierta unidad o patrón de medida, cabe en el objeto a medir. Para medir la longitud de un objeto físico nosotros desplazamos una regla o cinta graduada sobre el mismo, observando cuantas unidades (en este caso centímetros o metros) abarca el objeto en cuestión. Es decir que comparamos el objeto con nuestro patrón de medición para determinar cuántas unidades y fracciones del mismo incluye.

La medición de variables no físicas resulta, en esencia, un proceso idéntico al anterior. La dificultad reside en que las variables de este tipo no pueden medirse con escalas tan sencillas como las lineales y en que, por otra parte, no existen para su comparación patrones de medida universalmente definidos y aceptados. Si deseamos medir el peso de un objeto podremos expresar el valor del mismo en kilogramos, libras o cualquier unidad que, de todas maneras, tiene un equivalente fijo y constante con las otras que utilizan. En cambio para medir el grado de autoritarismo de un dirigente no existe ni una unidad ni una escala generalmente reconocidas, por lo que el investigador se ve obligado a elegir alguna escala de las que se han utilizado en otros trabajos o, lo que es bastante frecuente, a construir una adaptada a sus necesidades específicas. Resulta evidente, además, que el grado de autoritarismo no es una variable simple como el peso y la longitud, sino una resaltante compleja de una multitud de acciones y actitudes parciales. Por esta razón, medir un concepto complejo implica realizar una serie de operaciones que no tienen lugar en el caso de variables como el peso o la longitud; será necesario definir las dimensiones que integran la variable, encontrar indicadores diversos que la reflejen y construir luego una escala apropiada para el caso.

Una escala puede concebirse como un continuo de valores ordenados correlativamente que admite un punto inicial y otro final. Si evaluamos el rendimiento académico de estudiantes podemos asignar el valor cero al mínimo rendimiento imaginable al respecto; al mayor rendimiento posible podemos atribuirle un valor de 100, 20, 10 o 7 puntos, según resulte más práctico. Con estos dos valores tendríamos ya marcados los límites de nuestra escala; para concluir de confeccionarla será necesario asignar a los posibles rendimientos intermedios puntajes también intermedios. Con ello obtendremos una escala capaz de medir la variable rendimiento académico a través de los indicadores concretos de los trabajos presentados por los estudiantes, de sus exámenes, pruebas y otras formas de evaluación posibles.

Page 15: Estadistica Descriptiva e Inferencial

Para que una escala pueda considerarse como capaz de aportar información objetiva debe reunir los dos siguiente requisitos básicos:

A. Confiabilidad: se refiere a la consistencia interior de la misma, a su capacidad para discriminar en forma constante entre un valor y otro."Cabe confiar en una escala – anotan Goode y Hatt- cuando produzca constantemente los mismos resultados al aplicarla a una misma muestra", es decir, cuando siempre los mismos objetos aparezcan valorados en la misma forma.

B. Validez: indica la capacidad de la escala para medir las cualidades para las cuales ha sido construida y no otras parecidas. Una escala confusa no puede tener validez, lo mismo que en una escala que esté midiendo, a la vez e indiscriminadamente, distintas variables superpuestas. "Una escala tiene validez cuando verdaderamente mide lo que afirma medir".

Existen diferentes tipos de escalas que se distinguen de acuerdo a la rigurosidad con que han sido construidas y al propio comportamiento de las variables que miden. Se acostumbra a clasificarlas en cuatro tipos generales que son los siguientes: escalas nominales, ordinales, de intervalos iguales y de cocientes o razones.

Escalas nominales son aquellas en que sólo se manifiesta una equivalencia de categorías entre los diferentes puntos que asume la variable. Es como una simple lista de las diferentes posiciones que pueda adoptar la variable, pero sin que en ella se defina ningún tipo de orden o de relación. Si es una investigación sobre producción agrícola queremos determinar los cereales que se cultivan en una cierta región, tendremos una variable que se designará como "cereal cultivado". Los distintos valores que esa variable reconoce serán, concretamente: trigo, maíz, centeno, etc. Entre estos valores no cabe obviamente ninguna jerarquía, no se puede trazar ningún ordenamiento. Sin embargo, a la enunciación explícita de todas estas posibilidades la consideramos como una escala, pues de algún modo es útil para medir el comportamiento de la variable, indicándonos en que posición se halla en cada caso.

Las escalas ordinales distinguen los diferentes valores de la variable jerarquizándolos simplemente de acuerdo a un rango. Establecen que existe una gradación entre uno y otro valor de la escala, de tal modo que cualquiera de ellos es mayor que el precedente y menor que el que le sigue a continuación. Sin embargo la distancia entre un valor y otro no queda definida sino que es indeterminada. En otras palabras, tales escalas nos esclarecen solamente el rango que las distintas posiciones guardan entre sí. Un ejemplo de escala ordinal es el que suele usarse para medir la variable "grado de escolaridad": podemos decir que una persona que ha tenido 2 años de instrucción escolar ha recibido más instrucción que quien solo tiene un año y menos que quien posee tres. Sin embargo no puede afirmarse válidamente que la diferencia entre quien posee 2 años de instrucción y quien ha recibido un año es igual a la diferencia entre quienes han recibido 16 y 17años de educación formal. Por tanto, como no podemos determinar la equivalencia entre las

Page 16: Estadistica Descriptiva e Inferencial

distancias que separan un valor de otro, debemos concluir que la escala pertenece a la categoría ordinal.

Las escalas de intervalos iguales, además de poseer la equivalencia de categorías y el ordenamiento interno entre ellas, como en el caso de las ordinales, tienen las características de que la distancia entre sus intervalos está claramente determinada y que estos son iguales entre sí. Un ejemplo típico de las escalas de intervalos iguales esta dado por las escalas termométricas. Entre 23 y 24 grados centígrados, por ejemplo, existe la misma diferencia que hay entre 45 y 46 grados. Muchas otras escalas, como las que se utilizan en los test psicológicos y de rendimiento, pertenecen a este tipo. La limitación que poseen es que no definen un cero absoluto, un valor límite que exprese realmente la ausencia completa de la cualidad medida. Por ello no se pueden establecer equivalencias matemáticas como las de la proporcionalidad: no puede afirmarse que 24° C es el doble de temperatura que 12° C, porque el cero de la escala es un valor arbitrario y no se corresponde con la ausencia absoluta de la variable que se mide.

Por último tenemos las escalas de cocientes, llamadas también de razones. En ellas se conservan todas las propiedades de los casos anteriores pero además se añade la existencia de un valor cero real, con lo que se hacen posibles ciertas operaciones matemáticas, tales como la obtención de proporciones y cocientes. Esto quiete decir que un valor de 20 en una escala de este tipo es el doble de un valor de 10, o de las dos terceras partes de un valor de 30. Son escalas de cocientes las que miden la longitud, la masa, la intensidad de corriente eléctrica y otras variables del mundo físico. Difícilmente las variables que interviene en las ciencias sociales son medidas con escalas de razones, pues son contados los casos en que dichas variables pueden ser definidas con la exactitud y precisión necesarias. La economía y la demografía son, entre estas disciplinas, las que más utilizan escalas de razones.

INSTRUMENTOS DE MEDICIÓN

Page 17: Estadistica Descriptiva e Inferencial

Un instrumento de recolección de datos es, en principio, cualquier recurso de que se vale el investigador para acercarse a los fenómenos y extraer de ellos información. Ya adelantábamos que dentro de cada instrumento concreto pueden distinguirse dos aspectos diferentes: forma y contenido. La forma del instrumento se refiere al tipo de aproximación que establecemos con lo empírico, a las técnicas que utilizamos para esta tarea. En cuanto al contenido éste queda expresado en la especificación de los datos que necesitamos conseguir; se concreta, por lo tanto, en una serie de ítems que no son otra cosa que los mismos indicadores que permiten medir las variables, pero que asumen ahora la forma de pregunta, puntos a observar, elementos a registrar, etc. De este modo, el instrumento sintetiza en sí toda la labor previa de investigación: resume los aportes del marco teórico al seleccionar datos que corresponden a los indicadores y, por lo tanto, a las variables o conceptos utilizados; pero también expresa todo lo que tiene de específicamente empírico nuestro objeto de estudio pues sintetiza, a través de las técnicas de recolección que emplea, el diseño concreto escogido para el trabajo.

Es medianamente una adecuada construcción de los instrumentos de recolección que la investigación alcanza entonces la necesaria correspondencia entre teoría y hechos; es más, podríamos decir que es gracias a ellos que ambos términos efectivamente se vinculan. Si en una investigación los instrumentos son defectuosos se producirán, inevitablemente, algunas de las dificultades siguientes: o bien los datos recogidos no servirán para satisfacer los interrogantes iniciales o bien so se podrán obtener los datos que necesitamos, o vendrán falseados, distorsionados, porque el instrumento no se adecua al tipo de hechos en estudio. En ambos casos habrá, seguramente, uno o varios errores en las etapas anteriores del proceso de investigación. Será entonces necesario volver hacia atrás y revisar las diferentes tareas realizadas, hasta alcanzar una mejor aproximación al problema.

SÍMBOLOS ESTADÍSTICOS

Page 18: Estadistica Descriptiva e Inferencial

Abreviatura /símbolo Definición

Page 19: Estadistica Descriptiva e Inferencial

ANCOVA Análisis de covarianzaANOVA Análisis de varianza (univariado)

d medida del tamaño del efecto de Cohend' medida de sensibilidad

DT (SD) Desviación típica (Standard deviation)ECM (MSE) Error cuadrático medio (Mean square error)

ET (SE) Error típico (Standard error)ETM (SEM) Error típico de medida (Standard error of measurement)

gl (df) grados de libertad (degrees of freedom)f Frecuenciafe Frecuencia esperadag medida del tamaño del efecto de HedgeH0 Hipótesis nula bajo pruebaH1 Hipótesis alternativa

K-R 20 Fórmula de Kuder-RichardsonLSD Menor diferencia significativa de Fisher (Least significant difference)

M Media (artimética)MANOVA Análisis multivariado de varianza

Mdn MedianaMC (MS) Media cuadrática (Mean square)

ns No significativo

p Probabilidad. También representa la probabilidad de éxito en una variable binomial

P Porcentaje, percentilq 1 - p para una variable binomialQ Cuartil. También utilizada en la prueba de Cochranr Correlación producto-momento de Pearson

r2 Correlación producto-momento de Pearson al cuadrado. También representa al coeficiente de determinación

rS Correlación por rangos de Spearman

R Correlación múltiple. También representa el rango compuesto como prueba de significación

R2 Correlación múltiple al cuadrado; es una medida de la fuerza de asociación.RV (LR) Razón de verosimilitud (Likehood ratio)SC (SS) Suma de cuadrados (Sum of squares)

t valor calculado de la prueba tT2 valor calculado de la prueba de Hotellingx Abcisay Ordenadaz Puntuación típica

Page 20: Estadistica Descriptiva e Inferencial

DATOS ESTADISTICOS

Son números que pueden ser comparados, analizados e interpretados.

El campo del cual son tomados los datos estadísticos se identifican como población o universo.

En un estudio estadístico los métodos que se aplican son:

A. RECOPILACION: De acuerdo con la localización de la información los datos estadísticos pueden ser internos y externos.

Los internos son los registros obtenidos dentro de la organización que hace un estudio estadístico,

Los externos se obtienen de datos publicados y encuestas.

B. ORGANIZACIÓN: En la organización de los datos recopilados, el primer paso es corregir cada uno de los elementos recopilados.

C. REPRESENTACION: Hay 3 maneras de presentar un conjunto de datos mediante enunciados tablas estadísticas y gráficas estadísticas.

D. ANALISIS: Después de los datos anteriores los datos estadísticos están listos para hacer analizados, para lo cual frecuentemente se emplean operaciones matemáticas durante el proceso de análisis.

Si una muestra es representativa de una población se pueden deducir importantes deducciones acerca de esta a partir del análisis de la misma.

Una muestra es un conjunto de medidas u observaciones tomadas a partir de una población dada.

FUENTES DE DATOS ESTADÍSTICOS:

Para recoger información usted puede considerar dos tipos de fuentes:

FUENTES PRIMARIAS que son aquellas que nos proporcionan información directamente desde el objeto de estudio, para ello se pueden utilizar:

1. Encuestas

Page 21: Estadistica Descriptiva e Inferencial

2. Entrevistas

3. Datos recogidos de laboratorio

4. Censos

Por ejemplo, si se realiza una encuesta a los consumidores de un producto que está siendo investigado, los datos que se recogen se constituyen en datos primarios puesto que se ha recurrido a la fuente que directamente nos otorga los datos. Estos datos se encuentran, si cabe el término, en “bruto”, a partir de lo cual se inicia el proceso de clasificación, organización, presentación, sea en tablas o en gráficas.

FUENTES SECUNDARIAS, son aquellas que nos proporcionan información que ha sido previamente elaborada por otras personas y se recogen generalmente de:

1. Informes escritos

2. Revistas

3. Periódicos

4. Diferentes publicaciones

5. Boletines, etc.

Por ejemplo, si se toma un boletín estadístico del Banco Central, allí podremos encontrar información que ya ha sido procesada y podemos trabajar con esos datos para establecer promedios o características adicionales sobre el tema que nos interesa analizar.

En una investigación se puede utilizar tanto fuentes primarias como fuentes secundarias, si nos interesa no solo describir información sino además relacionar con datos previamente trabajados por otras organizaciones o personas.

HISTORIA BREVE DE LA ESTADÍSTICA

Desde los inicios de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas.

Page 22: Estadistica Descriptiva e Inferencial

En el antiguo EGIPTO, los faraones lograron recopilar, hacia el año 3050 antes de Cristo, amplios datos relativos a la población y la riqueza del país. De acuerdo al historiador griego Herodoto, dicho registro de riqueza y población, se hizo con el objetivo de preparar la construcción de las pirámides.

Los GRIEGOS clásicos, realizaban censos cuya información se utilizaba hacia el año 594 a. C. con fines Tributarios (pagar impuestos), Sociales (división de tierras y derechos de votos) y militares (cálculo de hombres disponibles   para la guerra y sus recursos).

Fueron los ROMANOS, maestros de la organización política, quienes mejor supieron emplear los recursos de la estadística. Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas contenidas en las tierras conquistadas.   Durante los mil años siguientes a la caída del imperio Romano, se realizaron muy pocas operaciones Estadísticas, con la notable excepción de los censos de tierras y bienes pertenecientes a la Iglesia católica romana.

Para el año 1532 empezaron a registrarse en INGLATERRA las defunciones debido al temor que Enrique VII tenía por la peste. Más o menos por la misma época, en FRANCIA la ley exigió a los clérigos registrar los bautismos, fallecimientos y matrimonios. Durante un brote de peste que apareció a fines de la década de 1500, el gobierno inglés comenzó a publicar estadísticas semanales de los fallecimientos.

Godofredo Achenwall, profesor de la Universidad de Gotinga, Alemania, acuñó en 1760 la palabra ESTADÍSTICA, que extrajo del término italiano statista (estadista). Creía, y con sobrada   razón, que los datos de la nueva ciencia, serían el aliado más eficaz del gobernante consciente. Por otro lado, la raíz remota de la palabra Estadística, se halla, en el término latino status, que significa “estado o situación”.

En resumen, la estadística es una ciencia con tanta antigüedad como la escritura, y es en nuestros días, un método efectivo y auxiliar de todas las demás ciencias que les sirve para relacionar, analizar y describir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos entre otros.

CONCLUSIÓN

Después de haber brindado algunas nociones básicas de la estadística, sus objetivos, calificación y las diferentes técnicas que la misma utiliza para estudiar una determinada población, podemos sintetizar lo siguiente: la estadística es una ciencia, debido a que utiliza métodos de investigación

Page 23: Estadistica Descriptiva e Inferencial

científica y a la vez es una serie de herramientas, instrumentos y estrategia para estudiar a una población.

Por otra parte, la estadística se califica en descriptiva e inferencial. Donde la primera estudia los métodos de recolección y descripción de los fenómenos en estudios; mientras que la otra se dedica a la generación de los métodos, inferencias y predicciones asociados a los fenómenos en cuestión, teniendo en cuenta lo aleatorio e incertidumbre en las observaciones.