Download - Estadistica Basica Con RCommander UNED

Transcript
  • 8/20/2019 Estadistica Basica Con RCommander UNED

    1/125

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    2/125

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    3/125

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    4/125

    !"#$%&"#'($ *+"'($ (,- ./(,00$-%!. 

    $1234567

    !"#$"%$ '(#() *+,,-"

    .(/0$ 1("%+0 2,("3$ 4(/(00+,$

    5637( !#$,,()(8()#% !03(,(9

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    5/125

    !"#$%&"#'($ *+"'($ ,$-$ ./0122$3%4-

    5-'24-$ 4%'('637 893'1 %4 :;

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    6/125

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    7/125

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    8/125

    Estadística básica con R-Commander

    #ndice de contenido1.- resentaci)n de R R-Commader: instalaci)n. 1;$< es R................................................................1=or $< $sar R>..................................................2?nstalar R..............................................................3?nstalar R-Commander........................................4?nterface de R-Commander...............................11@rani%aci)n de los datos.................................13

    Entrada de datos................................................1'A$toeal$aci)n..................................................15Actiidades.........................................................22Referencias.........................................................22

    2.- ?ntrod$cci)n te)rica al análisis e6ploratorio..23=;$< es el análisis e6ploratorio>......................238ipos de ariables..............................................2'

    Bieles de medida..............................................24atos en R...........................................................31A$toeal$aci)n..................................................3#Actiidades.........................................................3Referencias.........................................................#

    3.- Estadísticos descriptios básicos con R-Commander............................................................#

    ?ntrod$cci)n.......................................................#

    Dedia..................................................................#5Dediana..............................................................'2C$artiles.............................................................'ercentiles..........................................................'4Doda...................................................................*Rano o amplit$d...............................................3arian%a desiaci)n típica.............................'

    112

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    9/125

    Estadística básica con R-Commander

    Coeficiente de ariaci)n...................................."ráficos básicos en R-Commander...................1

    A$toeal$aci)n..................................................Actiidades.........................................................5

    #.- ?ntrod$cci)n al análisis correlacional con R...43?ntrod$cci)n.......................................................43Correlaci)n con R-Comannder..........................4'Reresi)n con R..................................................53"ráficos de inter

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    10/125

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    11/125

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    12/125

    Introducción

    En este documento se presenta un curso de inicial de estadísticabásica, pensado sobre todo para personas que no tienen ningún

    conocimiento y necesitan adquirir los conceptos básicos en pocotiempo. Como recurso técnico se recurre a R-Commander (partede R). R es un programa de análisis de datos de cdigo abierto ygratuito que e!iste gracias al traba"o de multitud dedesarrolladores en todo el mundo. En este sentido, el presentemanual es también un curso de iniciacin a R-Commander.

    #ara dise$ar y elaborar este manual se %a tratado de &incular lapráctica y la teoría a partir de distintos ob"eti&os y cuestiones de

    interés.

    'unque para su realiacin se %a querido tener en cuenta ladi&ersidad de campos donde es útil la estadística, por desgracia,la imposibilidad material de abarcarlos en un documento comoeste, %ace que no se %ayan podido incluir e"emplos de todosellos. En este sentido, se es consciente de que el manual presenta

    cierto sesgo %acia las ciencias sociales y de la salud. o obstante,se espera que la e!posicin sea comprensible para todos loslectores.

    El &olumen que se inicia aquí está organiado en &arioscapítulos. ' lo largo del primer capítulo se realia una e!posicinde qué es R, sus *unciones y características como programain*ormático. En el segundo capítulo se tratan algunos conceptosbásicos sobre medicin que serán *undamentales para el traba"o

    con los datos. En el capítulo tercero se tratan los procedimientosa seguir para realiar algunos análisis descripti&os sencillos. #orúltimo, el capítulo cuarto o*rece una introduccin al análisiscorrelacional.

    +odos los capítulos incluyen un cuestionario de auto&aloracin,así como distintos e"ercicios prácticos. 'unque cuando se traba"acon programas in*ormáticos uno de los problemas suele ser laaparicin de nue&as &ersiones con modi*icaciones sustanciales,

    en el caso de R no sucede así. a e&olucin de R es pausada y

    i

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    13/125

    progresi&a, de manera que los desarrollos se basan en el estadopre&io sin cambios demasiado radicales. e esta *orma, %asta la*ec%a, los procedimientos de uso de R no se &en alterados entre

    &ersiones, lo que garantia que el tiempo que dediquemos aaprender a utiliar R, podrá ser amortiado con creces.

    ii

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    14/125

    Estadística básica con R-Commander

    1.- Presentación de R y R-Commader:instalación

    Objetivos:

     – Conocer R.

     – Conocer algunas de sus ventajas e inconvenientes conrelación a otros programas.

     – Saber instalar R y R-Commander.

     – Saber importar datos a R.

    Cuando termine la unidad deberá:

     – Saber qué es R y para qué se utiliza.

     – Instalar R y sus librerías.

     – estionar datos en R.

    Qué es RR es un programa de an!lisis de datos. "ien# con esto seríasu$iciente para la mayoría de personas# sin embargo# quedarse a%íes desacreditar este so$t&are. R es muc%o m!s# es un lenguaje deprogramación que est! especializado en la gestión y an!lisis de

    datos. 'n este sentido# R est! a la altura de lenguajes como(atlab) o (at%am!tica* entre otros.

    R $ue desarrollado inicialmente por Robert entleman+  y RossI%a,a  del epartamento de 'stadística de la /niversidad de

    1 http://www.mathworks.com/2 http://www.wolfram.com/mathematica/3 http://en.wikipedia.or/wiki/Robert!"entleman

    # http://www.stat.a$ckland.ac.n%/&ihaka/

    1

    http://0.0.0.0/http://0.0.0.0/http://0.0.0.0/http://0.0.0.0/http://0.0.0.0/http://www.mathworks.com/http://www.wolfram.com/mathematica/http://en.wikipedia.org/wiki/Robert_Gentleman_(statistician)http://www.stat.auckland.ac.nz/~ihaka/http://0.0.0.0/http://0.0.0.0/http://0.0.0.0/http://0.0.0.0/http://www.wolfram.com/mathematica/http://en.wikipedia.org/wiki/Robert_Gentleman_(statistician)http://www.stat.auckland.ac.nz/~ihaka/http://www.mathworks.com/

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    15/125

    Estadística básica con R-Commander

    0uc,land en 1ueva 2elanda 30rriaza# 4ern!ndez# 5opez# (u6oz#7érez y S!nc%ez# *889: en );;+.

    R se %a desarrollado desde el principio# bajo licencia 1/-75

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    16/125

    Estadística básica con R-Commander

    m=ltiples variables requiere algo m!s de preparación de los datosque otras aplicaciones. Igualmente# es menos atractivo que otros

    programas# sobre todo en la $orma de presentar los resultados. 'neste sentido# llama la atención que mientras otros programaso$recen los resultados $ormateados 3en tablas con bordes biense6alados# con índices laterales# etc.: $acilitando su lectura ygestión 3por ejemplo# para copiar y trasladar a un procesador dete?to: R presenta los resultados en $ormato te?to# sin atributosgr!$icos. 7or otro lado# R requiere cierto conocimientoestadístico para aplicar las técnicas correctamente. 'sto puede serun inconveniente# sobre todo cuando se est! %abituado a pulsarcon el ratón# para elegir una técnica de an!lisis# y así obtener unasalida de resultados est!ndar# con todos los valores de re$erencia#niveles de signi$icación# probabilidades# etc. 0unque estasituación puede resultar algo incomoda# esperamos que a lo largode este manual se demuestre que es mejor conocer algo sobre latécnica que estamos aplicando# $acilit!ndonos así lainterpretación de sus resultados# que limitarnos a presionar sobreuna opción y obtener un montón de resultados sin sentido.

     Instalar R5a instalación de R es algo distinta seg=n se trabaje con uno uotro sistema operativo. 1o obstante# sólo requiere unos pocosclic,s de ratón para disponer de la aplicación.

    Instalación en windows

    7ara el caso de &indo&s vamos a presentar dos procedimientos.'l primero de ellos es el %abitual# el est!ndar. 'l segundo esposible gracias al proyecto R-/C0) de la /niversidad de C!diz3'spa6a:.

    1 http://kn$th.$ca.es/

    3

    http://0.0.0.0/http://knuth.uca.es/http://0.0.0.0/http://knuth.uca.es/

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    17/125

    Estadística básica con R-Commander

    'n la primera opción# bajamos el programa autoejecutable de lasiguiente dirección*@ 

    %[email protected]&indo&sbaseR-*.)

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    18/125

    Estadística básica con R-Commander

    utilizar la versión normal 3icono R:.

    Resumen@

     – 'n el navegador escribimos la dirección %[email protected]?R-*.)

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    19/125

    Estadística básica con R-Commander

    distribución /buntu de la >unta de 0ndalucía que dispone de Ren el repositorio:. Con /buntu se puede instalar desde el ECentro

    de so$t&are de /buntuF accesible en el men= E0plicacionesF odesde el men= de EGerramientas del sistemaF dependiendo de ladistribución que se tenga instalada 3imagen ):.

    'n la distribución de /buntu 3también en uadaline?: lainstalación de R y R-Commander se puede %acer al mismotiempo desde los repositorios. 7ara ello se busca la aplicaciónRcmdr en el instalador del men= de aplicaciones.

    Hambién se puede instalar desde el administrador de descargas .7ara ello# seleccionamos los arc%ivos R-base y aplicamos lainstalación.

    Si por el contrario no disponemos de una distribución /buntu# obien queremos %acerlo personalmente# lo primero ser! actualizarlos repositorios. 7ara conocer los repositorios nos dirigimos a lasiguiente dirección &eb@ %[email protected]?. 0llí podemos elegir la carpeta con la distribución que nos

    interesa 3imagen *:.'n el caso de la distribución /buntu# para obtener los paquetesde R# debemos a6adir las siguientes entradas en el arc%ivoetcaptsources.list de nuestro sistema@

    debhttp:///bin/linux/ubunu precise/debhttp:///bin/linux/ubuntu oneiric/debhttp:///bin/linux/ubuntu natty/debhttp:///bin/linux/ubuntu lucid/

    # $ede $tili%arse c$al$ier prorama de descaras como por

    e0emplo spnaptic.

    http://0.0.0.0/http://0.0.0.0/http://cran.es.r-project.org/bin/linux/http://0.0.0.0/http://0.0.0.0/http://0.0.0.0/http://0.0.0.0/http://cran.es.r-project.org/bin/linux/http://cran.es.r-project.org/bin/linux/

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    20/125

    Estadística básica con R-Commander

    debhttp:///bin/linux/ubuntu hardy/

    7ara editar el arc%ivo anterior se teclea en la terminar la siguienteorden de comandos@

    sudo gedit /etc/apt/sources.list

    0 continuación abrimos la terminal del sistema y tecleamos los

    siguientes comandos@sudo apt-get updatesudo apt-get install r-base

    Imagen *. Carpetas de R para las distribuciones linu?%[email protected]?

    Resumen@

     – 4orma )@ esde el administrador de aplicacionesbuscamos el programa R-base y procedemos a suinstalación.

    http://cran.es.r-project.org/bin/linux/http://cran.es.r-project.org/bin/linux/

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    21/125

    Estadística básica con R-Commander

     – 4orma *@ 0ctualizamos los repositorios. esde laterminal actualizamos el sistema e instalamos los

    paquetes de R.

     Imagen 3. Mirrors de CRAN 

     Instalar R-Commander R-Commander es una aplicación que trabaja dentro de R. Se tratade un programa que genera un inter$ace gr!$ico# similar aaplicaciones como S7SS. 5a ventana de R-Commander $acilita eltrabajo# evitando tener que aprender los comandos de R. 7arainstalarlo abrimos R# y en la pantalla que se abre# la consola#escribimos lo siguiente@

    4

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    22/125

    Estadística básica con R-Commander

    install.packages(“cmdr!"dependencies#$%&'

    7uede que nos aparezca una pantalla con un listado de servidoresdonde est!n alojados los programas de R 3son mirrors# es decir#servidores que tienen alojados una imagen de la aplicación R ysus p!ginas &eb:. Seleccionamos el mirror Spain 3(adrid:#aunque podemos elegir cualquier otro mirror 3imagen +:.

    5a librería R-Commander se instalar! por si sola. urante elproceso se instalar!n autom!ticamente otros paquetes que R-

    Commander necesita./na vez instalada la librería y todas sus dependencias# podemosabrir el programa R-Commander# tecleando@

    library(cmdr'

    Si no %ay ning=n problema aparecer! la venta de Commander.

    Cada vez que se utiliza R-Commander debemos abrir R yposteriormente escribir Elibrary3Rcmdr:F.

    Resumen@

     – 0brimos R.

     – Hecleamos Einstall.pac,ages 3ERcmdrF#dependenciesHR/':F.

     – 'legimos un servidor mirror 3por ejemplo

    Spain3(adrid:.

     – ejamos que se instalen todas las librerías.

     – 'scribimos library3Rcmdr:.

    5

    http://0.0.0.0/http://0.0.0.0/

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    23/125

    Estadística básica con R-Commander

     Imagen 4. Inter$ace de R-Commander

    1*

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    24/125

    Estadística básica con R-Commander

    'n la instalación en (ac# R-Commander puede que se instale sintodos los submen=s 3para m!s in$ormación $oro de

    %ttp@,nut%.uca.es:. Se trata de un error in$ormado por el propiocreador del paquete 3>o%n 4o?D:.

    Si utiliza 5inu? es aconsejable que incluya el siguiente script enel directorio donde se %a instalado R-Commander 3normalmenteestar! instalado en el directorio EusuarioJ%omeRi9D-pc-linu?-gnu-library*.).+RcmdrF 3Contreras# n.a.:

    )/bin/bash permisos -*ommander

    find . -type d -print + xargs chmod ,find . -type f -a +) -name configure-print + xargs chmod

    Como se %a apuntado antes# la distribución de 5inu?# /buntu#$acilita todo este proceso al incorporar en los respositorios elacceso directo a Rcmdr. 7ara ello# desde el centro de descarga deaplicaciones se elige la aplicación Rcmdr# se procede a suinstalación y al ejecutarse se instalan todos los complementos 3elproceso puede durar unos treinta minutos:.

     Interface de R-Commander 'l inter$ace de R-Commander 3im!genes  y

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    25/125

    Estadística básica con R-Commander

     – 'n el men= E'ditarF aparecen las opciones %abituales decopiar# pegar# buscar# etc.

     – 'l men= EatosF nos permite importar datos# así conabrir arc%ivos de datos y gestionarlos.

     – 'l men= F'stadísticosF incluye los an!lisis m!s$recuentes en estadística.

     – Er!$icasF incluye las opciones principales para realizargr!$icos sencillos.

     – 'n E(odelosF se tienen distintos submen=s que permitencalcular intervalos de con$ianza# realizar tests de%ipótesis# gr!$icas de modelos# diagnósticos numéricos#etc.

     – 'n EistribucionesF se incluye un conjunto de%erramientas para crear y trabajar con distribuciones deprobabilidad.

     – EGerramientasF incluye opciones para cargar paquetes yplug-ins.

    >usto debajo de la barra de men=es e?isten dos botones 3*: quepermiten editar y visualizar los datos. 5os datos aparecen en unaventana $lotante en el escritorio. 'n los e?tremos de estosbotones %ay otros dos# uno de ellos indica el conjunto de datosque est! activo 3es especialmente =til cuando se trabaja con

    varios grupos de datos al mismo tiempo: y el otro el modelo enactivo. 'l botón E'jecutarF es =til cuando se quiere ejecutar unaorden# script# secuencia de comandos o $unción. 'stos comandos#script# etc.# se pueden redactar en el espacio 3:. 'n este mismo!rea aparecen las secuencias de comandos en lenguaje R# amedida que trabajemos con R-Commander.

    'n el !rea 3ustodebajo e?iste una zona en gris 3D:# donde R-Commander muestra

    12

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    26/125

    Estadística básica con R-Commander

    los avisos de realización de las tareas# así como los problemasque pueden surgir con algunos an!lisis 3en este caso la nota de

    aviso aparece en color rojo:.

    Organización de los datos'n el an!lisis estadístico se trabaja con in$ormación que serecoge de una $uente determinada. 7or ejemplo# el nivel deglucosa en sangre de una persona es un dato 3nivel de glucosa:que nos da in$ormación 3interpretación del dato: sobre la

    situación de un persona 3$uente de in$ormación:# la carga m!?ima3dato: de un ascensor 3$uente: nos da in$ormación sobre lascondiciones de uso# la cali$icación 3dato: que %emos tenidonosotros 3$uente: en en una asignatura# indica si %emos aprobadoo no 3in$ormación:# etc.

    Resulta evidente lo $undamental que es elegir bien tanto la $uentecomo el tipo de dato. e esta $orma# eligiendo correctamente quéo quien suministra los datos# y qué tipo de dato necesitamos#

    podemos llegar a obtener la in$ormación que realmentenecesitamos.

    /na vez que se tienen los datos adecuados# éstos se organizan enuna tabla de doble entrada# donde las $ilas son las $uentes y lascolumnas son las variable 3%ttp@es.&i,ipedia.org&i,iKariable:.'n cada una de las celdillas se pondr! el dato que la $uentecorrespondiente 3$ila: %a aportado con relación a la variable3columna:. 0 esta tabla le llamaremos matriz de datos.

    'n la tabla ) se presenta una matriz de datos como ejemplo. Setrata de la intención de voto de )) personas en unas eleccionespresidenciales. 5a primera columna indica la $uente# es decir# lapersona que %a contestado 3persona )# persona *# persona +# L:mientras que en la primera $ila est!n las variables 3region#population# se?#...:.

    13

    http://es.wikipedia.org/wiki/Variablehttp://0.0.0.0/http://0.0.0.0/http://es.wikipedia.org/wiki/Variable

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    27/125

    Estadística básica con R-Commander

     Imagen 5. escripción inter$ace R-Commander

    1#

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    28/125

    Estadística básica con R-Commander

    'sta es la $orma b!sica de organizar los datos# $ilas por columnas#siendo las $ilas las personas o cosas que nos aportan los datos y

    las columnas las distintas cuestiones sobre las que queremostener in$ormación.

    Tabla 1. Ejemlo de matri! de datos

    region oulation se" age education income #ote

    ) 1 )M

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    29/125

    Estadística básica con R-Commander

    7ara escribir los datos directamente# se puede seguir elprocedimiento representado en la imagen D.

     Imagen $. Entrada de datos directamente

    Si se %a construido una matriz datos en otra aplicación# se puedeimportar la tabla resultante desde el men= EatosF eligiendo elsubmen= de importación. entro de las posibilidades queaparecen# elegimos la primera opción# siguiendo el proceso

    representado en la imagen M.5os arc%ivos que se importan desde la opción de arc%ivo dete?to# portapapeles o /R5 debe cumplir una serie de condicionesde $ormato@

     – 'l arc%ivo debe estar en $ormato de te?to 3t?t o ascii:.

     – 5as columnas deben separarse siempre de la misma$orma. 7ara ello se puede utilizar uno o varios espacios#

    1

    atosO1uevo conjunto de datosP

    'scribir nombre de arc%ivoP

    Se abre el editor de datosP

    Se escriben los datosP

    7ulsar sobre var)OSe abre el editor de variablesP

    amos un nombre a la variable.Repetimos el proceso con todas lasvariables

    P

    Cerramos las ventanas de edición

    http://0.0.0.0/http://0.0.0.0/http://0.0.0.0/http://0.0.0.0/

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    30/125

    Estadística básica con R-Commander

    o bien tabuladores.

     – 5os datos que $altan se deben indicar con un valor. 7orde$ecto R utiliza la e?presión E10F 3not available:.

     – R distingue entre $actores 3variables categóricas:# yvariables numéricas 3ver capítulo siguiente:.

     – R distingue entre may=sculas y min=sculas# por lo tantoel nombre del arc%ivo debe tener siempre la mismatipogra$ía.

     – R no permite espacios en los nombres de los arc%ivos.

     Imagen %. Imortaci&n de datos

    'n el caso de importar arc%ivos desde el portapapeles# lo querealmente se %ace es pegar los datos. 7ara ello# se crea el arc%ivode datos seg=n el $ormato indicado# abriendo el arc%ivo en unprocesador de te?to u %oja de c!lculo. 0 continuación# seselecciona la matriz y se copia. e esta $orma# R puede recuperarlos datos desde el mismo portapapeles.

    1

    atosOImportar datosO

    PSe abre el di!logopara leer los datos

    P'legir la opcióncorrespondiente@ arc%ivo#portapapeles o /R5

    P7ulsar abrir

    esde arc%ivo de te?to#portapapeles o /R5

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    31/125

    Estadística básica con R-Commander

    R-Commander también puede importar matrices de datosrealizadas en los programas S7SS# (initab o SH0H0. Cada uno

    tiene su propia ventana de di!logo para la importación.Resumen@

     – Se pueden escribir los datos directamente en R-Commander a través del editor de datos 3atosO1uevoconjunto de datos:.

     – Se puede importar los datos desde un arc%ivo de te?to.

     – Se puede importar los datos desde matrices de datos%ec%as por S7SS# SH0H0 o (initab.

    /na vez que se %an revisado algunos procedimientos paraincorporar los datos al programa# es obligatorio decir que estetrabajo de importación se $acilita bastante si se utiliza una %ojade c!lculo e?terna# para preparar antes la matriz 3'?cel# Calc#etc.:. /na vez completa la matriz en la %oja de c!lculo# se guarda

    en $ormato te?to separados por tabuladores. e esta $orma# elarc%ivo se puede importar directamente a R# con el $ormatoadecuado# y con la comodidad de trabajar con la %oja de c!lculosin necesidad de tener cargado R-Commander.

    14

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    32/125

    Estadística básica con R-Commander

     Autoealuación).- R es similar a otros programas# como@

    0: (atlab

    ": 7%ots%op

    C: '?cel

    R'S7/'SH0@ 0

    *.- R est! desarrollada bajo licencia@0: 7rivativa

    ": 1/-75

    C: 4R''

    R'S7/'SH0@ "

    +.- R-Commander es@0: /n programa independiente de R

    ": /na librería de R

    C: /n comando de R

    R'S7/'SH0@ "

    .- 7ara el an!lisis estadísticos los datos se organizan en@

    0: 5íneas de cuadros

    ": Secuencias numéricas

    C: (atrices de datos

    R'S7/'SH0@ C

    15

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    33/125

    Estadística básica con R-Commander

    (7

    ": QCH0K'

    C: S7SS

    R'S7/'SH0@ C

    D.- ué es RT0: /n lenguaje de programación dirigido a objetos.

    ": /n so$t&are de interpretación de an!lisis.

    C: /na %oja de c!lculo

    R'S7/'SH0@ 0

    M.- 7or qué R es recomendableT

    0: 7orque tiene una potencia superior a otros programas#como el S7SS.

    ": 7orque dispone de gran cantidad de librerías queabarcan casi todos los an!lisis

    C: 7orque %a sido desarrollado en lenguaje CU

    R'S7/'SH0@ "

    9.- 7or qué R no es recomendable en algunas ocasionesT

    0: 7orque presenta los resultados de manera ordenada#tabulada# maquetados y gr!$icamente atractiva.

    ": 7orque e?ige aprender algunos conceptos b!sicos deprogramación en R.

    C: 7orque la versión completa es de pago.

    R'S7/'SH0@ "

    2*

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    34/125

    Estadística básica con R-Commander

    ;.- ué es R-CommanderT

    0: 'l equipo de personas que %a desarrollado R.": 'l comando que %ay que escribir para iniciar R.

    C: 's una aplicación que o$rece un inter$ace gr!$ico paraR.

    R'S7/'SH0@ C

    )8.- 7ara crear una matriz de datos en R-Commander tenemos

    que ir al men=0: atos-V Importar datos.

    ": atos-V Crear matriz de datos.

    C: atos-V 1uevo conjunto de datos.

    R'S7/'SH0@ C

    21

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    35/125

    Estadística básica con R-Commander

     Actiidades).- 'l pro$esor pregunta al alumnado cu!ntos %ermanosas tienen.

    5as respuesta est! en la siguiente secuencia de n=meros 3cadadígito es una respuesta:. 7!salo a una matriz de datos en %ojade c!lculo.)# *# +# # *#

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    36/125

    Estadística básica con R-Commander

    2.- Introducción teórica al análisisexploratorioObjetivos:

     – Conocer los distintos tipos de variables.

     – Identi$icar los estadísticos que pueden o deben calcularseen $unción del tipo de variable.

    Cuando termine deberá:

     – Reconocer el nivel de medida de una variable.

     – Saber qué tipo de estadístico se puede calcular en$unción del nivel de medida.

    ¿Qué es el an!lisis e"#loratorio? 5a estadística suele dividirse en dos grandes bloques@ estadística

    descriptiva y estadística in$erencial. 5a estadística descriptivaincluye an!lisis que tratan de describir los datos en cuanto a suorganización 3posición y dispersión: y $orma 3apuntamiento ysesgo:. 7or su parte la estadística in$erencial trata de deducircómo es una población a partir de los datos recogidos de unamuestra representativa. 5a estadística in$erencial permitetambién comparar grupos entre sí# así como analizar la evoluciónde un mismo grupo a lo largo del tiempo.

    'l an!lisis e?ploratorio de datos 30': es un proceso de estudioque se aplica sobre los datos recogidos en una investigación# conel $in de identi$icar las características b!sicas de dic%os datos@descubrir patrones# regularidades# di$erencias# singularidades#casos anómalos# etc. 'l objetivo del 0' en obtener un mejorconocimiento del objeto de estudio. Se trata del an!lisispreliminar# el m!s b!sico y el primero que se %ace a un grupo dedatos.

    23

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    37/125

    Estadística básica con R-Commander

    0unque el an!lisis e?ploratorio incluye estadística descriptivo ein$erencial# en este manual vamos a tratar e?clusivamente el

    an!lisis descriptivo.'l proceso del an!lisis estadístico descriptivo# suele seguir lossiguientes pasos@

    ). Qrdenar y crear las tablas de datos.

    *. Calcular las medidas de posición central.

    +. Calcular las medidas de dispersión.

    . Calcular las medidas de $orma.

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    38/125

    Estadística básica con R-Commander

    'n cualquier caso# debemos tener claro que no es posible aplicartodos los an!lisis estadísticos a todas las variables. 'l proceso de

    medición determina qué an!lisis se pueden aplicar a unasvariables y cuales a otras. 'sto es muy importante porque# si nose distingue bien entre $ormas de medición y tipos de variables#podemos caer en errores que desvirt=en los resultados. 'n lossiguientes epígra$es se tratan con detalle estas cuestiones.

    $i#os de aria%les

    Comencemos este epígra$e de$iniendo el concepto de variablecomo todo aquel símbolo# vinculado a un $enómeno de larealidad# que adopta di$erentes valores.

    5as variables pueden clasi$icarse de muy di$erentes $ormas en$unción de distintos criterios. 0sí# desde un criterio metodológicose suelen clasi$icar en variables dependientes 3K:# variablesindependientes 3KI:# variables e?tra6as 3K': y variablesmoderadoras o mediadoras 3K(:.

    a: Kariable dependiente 3K:@ es la variable que nosinteresa medir y cuyo valor depende de la variableindependiente.

    b: Kariable independiente 3KI:@ variable que determina elestado de la variable dependiente. Se asume una relacióncausal entre la variable dependiente e independiente. 5asvariables independientes pueden estar totalmentecontroladas por los investigadores# de $orma que el valorque adopte esté determinado por la propia investigación3variable independiente e?perimental: o bien puede seruna variable que se re$iere a un tipo de $enómeno 3edad#género# estado meteorológico# ideología política# etc.:que no puede ser manipulado por los investigadores#pero cuyos valores son conocidos 3variableindependiente asignada:.

    2'

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    39/125

    Estadística básica con R-Commander

    c: Kariable e?tra6a@ aquella que in$luye en la K y que seescapa al control del dise6o de investigación. Su

    presencia a$ecta a la relación KI-K# de $orma que lasconclusiones que se e?traen en el estudio pueden sererróneas.

    d: Kariables moderadoras@ variables que est!n relacionadascon las KYs o KIYs# y que median entre ambas. 'nocasiones pueden enmascarar la verdadera relación entreKI y K# convirtiéndose también en $uentes de error a la%ora de e?traer conclusiones.

    Seg=n la naturaleza de las variables# se puede distinguir entrevariables discretas y contin=as@

    a: Kariable discreta@ es una variable que solamente puedeadoptar determinados valores# generalmente asociados alos n=meros enteros. 7or ejemplo# en una empresa eln=mero de trabajadores es una variable discreta# porque

    podemos tener )*# )+# )# )

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    40/125

    Estadística básica con R-Commander

    Tabla . Ni#eles de medida

    1ivel Características Qbservaciones 'jemplos1omi-nal ocategó-rica

    5asobservacionesse asignan aun grupo ocategoría.

    Cada elementopertenece a unacategoría. 1o sonadmisibles valoracionesde Zéste es m!s o menosque el otroZ# ni Zestovale tanto m!s o menosqueZ.

    Se suele llamar tambiénatributo.

    - Ser %ombre omujer.- Kotar a $avor oen contra dealgo.- 'l n=merotele$ónico decada persona.

    Qrdinal Se asigna unavaloración deorden a lasobservaciones.

    's admisible que algosea m!s o menos queotra cosa pero no puededecirse cu!nto es dem!s o menos.

    - 'mpleo en lasescalas militares.- Qrden dellegada en unacarrera.

    Interva-lo

    Se asume queentre los

    elementose?istendistancias quepuedendividirse enunidadese?actas yconstantes

    5a distancia entre dospuntos puede valorarse

    en $unción de intervalosde igual tama6o. 5adi$erencia# por ejemplo#entre )

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    41/125

    Estadística básica con R-Commander

    Igualmente# es posible distinguir entre variables politómicas ydicotómicas@

    a: Kariable politécnica@ variable que puede adoptar variosvalores. 7or ejemplo# cuando tenemos que elegir en elmen= del restaurante# donde ir a pasear# decidir entrevarias patologías posibles ante un diagnóstico clínico#etc.

    b: Kariable dicotómica@ variable que solamente puedeadoptar dos variables. 7or ejemplo# el se?o 3%ombre#mujer:# comprar algo o no comprarlo# poner unareclamación o no ponerla# activar un interruptor o noactivarlo# etc.

    Qtra clasi$icación interesante e importante# se basa en los niveleso escalas de medida. ada su relevancia# el siguiente epígra$etrata con detalle esta clasi$icación.

     &ieles de medida5as variables también pueden clasi$icarse en $unción de la escalade medida que se utiliza. 'sta clasi$icación distingue entrecualitativas nominales# cuasicuantitativas ordinales# cuantitativasde intervalo y cuantitativas de razón 3Steven# );

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    42/125

    Estadística básica con R-Commander

    c: Cuantitativas# cuando es posible utilizar al menos unaescala de intervalos para medir sus valores. 5a principal

    característica de la escala de intervalos es la utilizaciónde una unidad constante para realizar las mediciones.

    d: 7or su parte# las escalas de razón# adem!s# localizan uncero absoluto en la dimensión medida# a partir del cual seestablecen los valores con una unidad constante# talcomo ocurre con la escala de intervalos.

    'n la tabla * se describen brevemente las características de lasvariables seg=n los niveles de medida basados en la clasi$icaciónde Steven 3op.# cit.:. 'sta clasi$icación es importante porque tienedos consecuencias b!sicas@

     – Cada nivel de medida o$rece distinto grado dein$ormación. 0sí# los niveles de intervalo y razón aportanm!s in$ormación que las mediciones ordinales# y éstas asu vez# m!s que las nominales.

     – Cada nivel de medida permite aplicar un tipo de an!lisis.0sí# en los niveles nominal y ordinal carece de sentidoalgoritmos como la media aritmética. 's decir# para cadaescala tenemos que aplicar los estadísticos m!sadecuados en el an!lisis.

    'n principio# aunque siempre es aconsejable tratar de recoger

    datos medidos en la escala m!s alta posible# no todo puede sermedido a nivel de razón. 7or ejemplo# no es posible medir lainteligencia a nivel de razón porque técnicamente# %asta elmomento# no se %a podido establecer el punto de re$erencia EceroabsolutoF que permita dic%a medición. Sin embargo# los test deinteligencia est!n dise6ados para medir a nivel de intervalos. 'lse?o o género# por ejemplo# es una variable que sólo se puedemedir a nivel nominal. Cualquier otro tipo de medición sobredic%o $enómeno carece de sentido. 0sí# no es posible una

    25

    http://0.0.0.0/http://0.0.0.0/

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    43/125

    Estadística básica con R-Commander

    ordenación del género# puesto que# por ser %ombre o mujer no sees m!s ni menos 3ordinal:. 7or el contrario# la categoría

    pro$esional es un $enómeno de la realidad que puede medirse anivel ordinal. 5a di$erencia entre un nivel 0 y un nivel C son doscategorías pro$esionales# igual que la di$erencia entre el nivel yel nivel 4. Sin embargo# no e?isten garantías de que la distanciapro$esional entre 4 y # sea la misma que entre C y 0. 5o mismosucede con otros tantos $enómenos# como por ejemplo# la bellezade un paisaje. 7odemos ordenar dos paisajes en $unción de quenos guste m!s uno que otro# pero la di$erencia de apreciación dela belleza entre ellos# no tiene porqué ser ni equivalente# niproporcional# con respecto a la di$erencia que mantengan entre síla apreciación sobre otros dos paisajes.

    Escala Medidas

    centrales

    Medidas de

    dispersión

    epresentaciones

    !rá"icas

    1ominal (oda7orcentaje

    iagrama de sectores

    Qrdinal (ediana7ercentiles

    Recorridointercuartílico

    iagrama de barras

    Intervalos (edia esviación típica Gistograma

    Razón (edia Coe$iciente devariación

    Gistogramaiagrama de cajas

    Cuadro . Medidas ) gr(-icos seg/n tio de escala de medida0adatado de Arria!a, ern(nde!, 2&e!, Muo!, re! )

    6(nc7e!, 889: 11;

    'n cualquier caso# tal como se %a apuntado anteriormente# esaconsejable que siempre se trate de medir al nivel m!?imo que eldesarrollo tecnológico y nuestros recursos nos permitan. e esta$orma# es $!cil pasar de una medición de orden superior a unamedición de orden in$erior 3al contrario no es posible# nopodemos subir la escalera# solamente bajarla:. 7or ejemplo# simedimos la edad de los edi$icios de un centro urbano en a6os#

    después podremos crear categorías de edi$icios antiguos y

    3*

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    44/125

    Estadística básica con R-Commander

    edi$icios nuevos. 'l proceso inverso no es posible# es decir# quesabiendo sólo que un edi$icio es m!s antiguo que otro# no

    podemos conocer sus a6os.Como se %a dic%o anteriormente# es importante tener claro enqué nivel de medida est! construida cada variable porque de esta$orma sabemos qué tipo de in$ormación nos puede aportar. Sicon$undimos el nivel de medición podríamos realizar an!lisiscuyos resultados no tienen sentido o bien aportan in$ormaciónque no puede 3o no debe: ser interpretada.

    'n el cuadro * se indican algunos de los an!lisis numéricos ygr!$icos que pueden realizarse en $unción del nivel de medida.

     'atos en RR gestiona los datos a través de un amplio conjunto deelementos@ vectors# matrices# arrays# data$rames y $actors. Hodosestos elementos pueden utilizarse desde R-Commanderdirectamente.

     – Kector@ es un conjunto de datos ordenados en unasecuencia. 5os vectores pueden estar compuestos den=meros 3)# *# +# # L:# de caracteres 3EunoF# EdosF#EtresF# EcuatroF# L: o lógicos 3HR/'# 405S'# HR/'#L:. 'n el caso de vectores de caracteres# los elementosvan entre comillas 3E F:. 5os vectores lógicos se indicancon las palabras en inglés en may=sculas 3HR/' \405S':.

     – (atri?@ en R las matrices son conjuntos de datos#organizados en columnas y $ilas. /na matriz debe estarcompuesta por el mismo tipo de datos 3numéricos ocaracteres:.

     – 0rray@ es una generalización de las matrices con m!s dedos dimensiones.

    31

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    45/125

    Estadística básica con R-Commander

     – ata$rame@ son matrices cuyos elementos pueden ser dedistinto tipo# combinando columnas de tipo numérico y

    tipo car!cter. 's similar a los conjuntos de datos quegeneran otros programas de an!lisis como S7SS.

     – 4actor@ se trata de una variable considerada a nivelnominal u ordinal. 5os dos comandos b!sicos para estetipo de variable son $actor3: y ordered3:.

    5as tareas b!sicas para gestionar las variables en R-Commanderson accesibles desde el men= atos 3imagen 9:.

    32

    http://0.0.0.0/http://0.0.0.0/

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    46/125

    Estadística básica con R-Commander

     Imagen 9.

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    47/125

    Estadística básica con R-Commander

     Autoealuación

    ).- 5a estadística suele dividirse en dos grande bloques@0: escriptivo e intensivo

    ": escriptivo y restrictivo

    C: escriptivo e in$erencial

    R'S7/'SH0@ C

    *.- esde un punto de vista metodológico# la variable que

    interesa medir# y cuyos valores dependen de otras variables# sellama@

    0: Kariable independiente

    ": Kariable dependiente

    C: Kariable controlada

    R'S7/'SH0@ "

    +.- /na variable que se distribuye# secuencia u organiza# como si$uese a EsaltosF se conoce como variable@

    0: Continua

    ": iscreta

    C: (odular

    R'S7/'SH0@ "

    .- /n $enómeno de la realidad que se mide teniendo en cuenta elorden# se dice que est! medido a nivel

    0: 'scalar

    ": 1ominal

    C: Qrdinal

    R'S7/'SH0@ C

    3#

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    48/125

    Estadística básica con R-Commander

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    49/125

    Estadística básica con R-Commander

    ;.- ué son los niveles o escalas de medidaT

    0: Son las distancias que median entre las variables.": Son las medidas que tienen que tomarse para evitardatos adulterados.

    C: Son distintas categorías que agrupan a las variables.

    R'S7/'SH0@ C

    )8.- ué escala de medida o$rece m!s in$ormaciónT0: Intervalos.

    ": Razón.

    C: 1ominal.

    R'S7/'SH0@ "

    3

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    50/125

    Estadística básica con R-Commander

     ActiidadesIndica el nivel de medida de las siguientes variables@

    ) 5a intención de voto.0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@ 0

    * 'studios previos de secundaria que permite al alumnado

    acceder a la /niversidad 3Selectividad# mayores de *< a6os#4ormación 7ro$esional# etc.:@

    0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@ 0

    + rado de aceptación de los consumidores sobre un nuevoproducto# seg=n una escala que tiene las siguientes opciones@muy mal# mal# regular# bien# muy bien.

    0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@ "

    1=mero de accidentes laborales# en una empresa# durante unmes@

    0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@

    3

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    51/125

    Estadística básica con R-Commander

    < Hiempos de reacción de los conductores# medidos encentésimas de segundo@

    0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@

    D Conocimiento de estadística medido por un e?amen tipo test@0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@ C

    M 1ivel socioeconómico de un grupo# medidos seg=n una escalaen@ bajo# medio y alto.

    0: 1ominal": Qrdinal

    C: Intervalos: RazónR'S7/'SH0@ "

    9 'n una encuesta a los turistas# se les pregunta cuanto calorpasan en (!lagaT 5os encuestadores les o$recen cincoposibilidades@ 1inguno# algo# normal# bastante y muc%o.

    0: 1ominal

    ": QrdinalC: Intervalos: RazónR'S7/'SH0@ "

    34

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    52/125

    Estadística básica con R-Commander

    ; 1=mero medio de %ijos de un barrio de la ciudad@0: 1ominal

    ": QrdinalC: Intervalos: RazónR'S7/'SH0@

    )8 0$iciones deportivas de un grupo de alumnos@0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@ 0

    )) Cali$icaciones obtenidas por un grupo de alumnos desecundaria en literatura en un e?amen de desarrollo@

    0: 1ominal": QrdinalC: Intervalos

    : RazónR'S7/'SH0@ "

    )* iagnósticos clínicos en los pacientes que asisten un día a laconsulta de un doctor en un centro de salud@

    0: 1ominal": QrdinalC: Intervalos

    : RazónR'S7/'SH0@ 0

    )+ Se?o 3género: del alumnado de la 4acultad de 'conómicas@0: 1ominal": QrdinalC: Intervalos: Razón

    R'S7/'SH0@ 0

    35

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    53/125

    Estadística básica con R-Commander

    ) 2ona de residencia de los clientes de un comercio@0: 1ominal

    ": QrdinalC: Intervalos: RazónR'S7/'SH0@ 0

    )< 1iveles de agresividad de )

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    54/125

    Estadística básica con R-Commander

    )9 Importancia que otorgan un grupo de clientes a la apariencia$ísica de los dependientes# seg=n una escala@ poco# algo# muc%o.

    0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@ "

    ); rupos de clase en un centro escolar para cada uno de losniveles 3grupo a de )[# grupo b de )[# grupo c de )[# etc.:@

    0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@ 0

    *8 Cantidad de interacciones que un medicamento presenta conel resto@

    0: 1ominal

    ": QrdinalC: Intervalos: RazónR'S7/'SH0@

    *) 7robabilidad de que nos toque la lotería@0: 1ominal": Qrdinal

    C: Intervalos: RazónR'S7/'SH0@

    #1

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    55/125

    Estadística básica con R-Commander

    ** 'n un centro privado de ense6anza %an pasado una prueba decultura general a MD aspirantes. Se %a anotado en la solicitud de

    cada aspirante el n=mero de respuestas correctas e incorrectas@0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@ C

    *+ Cantidad de adictos al alco%ol en la provincia@0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@

    * 7roporción de circuitos de$ectuosos que recibe un comerciode su distribuidor a lo largo de un a6o.

    0: 1ominal

    ": QrdinalC: Intervalos: RazónR'S7/'SH0@

    *< 1=mero de alumnos con ansiedad en periodo de e?!menes@0: 1ominal": Qrdinal

    C: Intervalos: RazónR'S7/'SH0@

    #2

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    56/125

    Estadística básica con R-Commander

    *D 7orcentaje de é?itos de un $!rmaco a partir de )+* casos@0: 1ominal

    ": QrdinalC: Intervalos: RazónR'S7/'SH0@

    *M 1=mero de %ombres que asumen per$ectamente las tareasdomésticas junto con su pareja@

    0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@

    *9 1ivel de di$icultad para respirar que perciben los clientes deun establecimiento de %ostelería# valorado seg=n una escala@ )# *#+# #

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    57/125

    Estadística básica con R-Commander

    +8 1ivel de é?ito alcanzado por los antiguos alumnos de uncolegio# valorado seg=n renta per capita@

    0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@

    +) 1ivel de é?ito percibido por los antiguos alumnos de uncolegio# valorado seg=n una escala@ poco# medio# muc%o.

    0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@ "

    +* Cantidad de inmigrantes que se %a integrado seg=n una escalade apreciación@ muy poco# poco# regular# bastante# per$ectamente.

    0: 1ominal

    ": QrdinalC: Intervalos: RazónR'S7/'SH0@ "

    ++ 'dad media de los compradores potenciales de un producto@0: 1ominal": Qrdinal

    C: Intervalos: RazónR'S7/'SH0@

    ##

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    58/125

    Estadística básica con R-Commander

    + Situación de la drogodependencia en una ciudad# valoradaseg=n el n=mero jeringuillas utilizadas durante un mes en la

    población de drogodependientes controlados por los serviciossociales@0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@

    +< Inteligencia media de los empleados de una $!brica# valoradaseg=n un test de inteligencia@

    0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@ C

    +D Kelocidad que un conductor alcanza con su ve%ículo@

    0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@

    +M 1ivel de glucosa en sangre en una persona@0: 1ominal

    ": QrdinalC: Intervalos: RazónR'S7/'SH0@

    #'

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    59/125

    Estadística básica con R-Commander

    +9 1ivel de conocimiento sobre educación para la salud enalumnos de primaria# valorada seg=n un test especí$ico@

    0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@ C

    +; Hemperatura que soporta un material de construcción antes dealterarse# medido en grados centígrados@

    0: 1ominal": QrdinalC: Intervalos: RazónR'S7/'SH0@ C

    8 7roporción de personas que consideran atractiva a su pareja@0: 1ominal": Qrdinal

    C: Intervalos: RazónR'S7/'SH0@

     ReferenciasStevens# S.S. 3); o- e"erimental

     s)c7olog). 1e& Nor,@ >o%n ]iley.

    0rriaza# 0.>.# 4ern!ndez# 4.# 5ópez# (.0.# (u6oz# (.# 7érez# yS!nc%ez# 0. 3*889:.  Estad'stica b(sica con R ) R*Commander0?ersi&n -ebrero 889;.  C!diz@ /niversidad de C!diz.W%ttp@,nut%.uca.esebrcmdrX

    #

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    60/125

    Estadística básica con R-Commander

    3.- Estadísticos descriptios !ásicos conR-CommanderObjetivos:

     – Conocer los estadísticos descriptivos b!sicos.

     – Saber cómo calcular los estadísticos descriptivos en R-Commander.

    Cuando termine deberá:

     – Saber realizar un an!lisis descriptivo b!sico en $uncióndel tipo de variable.

     Introducción5a estadística descriptiva pretende describir cómo es el grupo deelemento que nos interesa estudiar 3personas# productos# tasas#

    voltajes# lugares# distancias# etc.:. 'n estadística descriptiva serecurre al menos# a dos tipos de indicadores que permiten dic%adescripción# por un lado los indicadores de posición y por otrolos indicadores de dispersión. 0unque e?isten otros como los de$orma o los de sesgo# sin embargo# los an!lisis imprescindiblesson los de posición y dispersión.

    4rente a lo dic%o anteriormente# cabe preguntarse por qué esnecesario trabajar al menos con dos indicadores. Sin entrar en

    una e?posición desde la lógica $ormal# vamos a e?poner algunosejemplos que ponen de mani$iesto los errores donde podemosincurrir si no se %ace de esta $orma. 7or ejemplo# de sobra esconocido el siguiente c%ascarrillo@

     Estamos dos ersonas.@o me como un ollo ) la otra no.6i calculamos la media, un ollo dos ersonas cadauno nos 7emos comido medio ollo.

    #

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    61/125

    Estadística básica con R-Commander

    'st! claro que indicar la posición media 3en el ejemplo seríamedio pollo: no es muy acertado para describir la situación.

    0unque el ejemplo puede resultar incluso gracioso# en muc%asocasiones# limitarnos a indicar la posición central alrededor de lacual se organizan los datos# puede rozar la manipulación y elenga6o. 7or ejemplo# si una persona tiene una nómina de D88euros mensuales# pero un día le toca la lotería 3supongamos que+88.888 euros: no se puede decir que ese a6o %aya obtenido unasganancias de *

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    62/125

    Estadística básica con R-Commander

    #ipo de variable Est$% de posición Est$% de dispersión

    Razón (edia Coe$iciente de variación

    Intervalos (edia Karianza# desviación típica

    Qrdinal (ediana y percentil Rango

    1ominal (oda

    Cuadro 3. Resumen de estad'sticos

     (edia5a media es un indicador de agrupación de los datos. Se trata deun punto central alrededor del cual orbitan estos. e $orma m!svisual# si cada dato $uese un cuerpo $ísico que se situase a lolargo de un listón sin masa# la media sería el punto de equilibrio#es decir# el lugar que mantendría en equilibrio al listón# con lospesos encima# como si $uese una balanza 3imagen ;:. 'se listónsin masa sería la representación de la dimensión que se mide@renta# tasa# carga# inteligencia# rendimiento# etc.

     Imagen B. 2a media como unto de euilibrio

    5a media aritmética# una de la m!s utilizada en investigacióndescriptiva en Ciencias Sociales# consiste en la suma de losvalores dividida por el n=mero total de casos.

    #5

    http://0.0.0.0/http://0.0.0.0/

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    63/125

    Estadística básica con R-Commander

     D =∑ "i

    n3'?presión ):

    0lgunas características de la media son las siguientes@

     – 5a suma de la di$erencia de la media con relación alresto de datos es cero.

     – 'l sumatorio del cuadrado de la distancia entre la mediay el resto de datos es el m!s peque6o posible.

     – 5a media es sensible a cualquier variación de cada unade las puntuaciones. 'l mínimo cambio en un solo valorpuede modi$icar la media.

     Imagen 18. C(lculo de la media

    Keamos el procedimiento de c!lculo con R-Commander en unejemplo. Supongamos que una empresa tiene cuatro trabajadorescuyos salarios son 988# )*88# ))88 y )M88 eurosrespectivamente. 'n primer lugar se crearía la matriz de datos y

    '*

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    64/125

    Estadística básica con R-Commander

    la pasaríamos a R-Commander. 7osteriormente abrimosE'stadísticosF# ERes=menesF y ERes=menes numéricosF desde la

    barra de men=. Se abrir! una ventana donde tenemos tresopciones 3media# desviación típica y cuartiles:. 1os aseguramosde que tenemos seleccionada la media y aceptamos. 'l resultadosaldr! en la ventana de resultados.

     Imagen 11. rocedimiento ara calcular la media

    Intente realizar los siguientes ejercicios@). 'n un concesionario quieren saber el n=mero medio de

    coc%es que venden por semana. urante < semanasanotan lo vendido@ )8# )*# *8# D y )8 3Solución@ )).D:.

    *. 'n una clase de secundaria se quiere analizar la alturamedia de los alumnos. Se toma una muestra de )8alumnos que miden en cm@ )

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    65/125

    Estadística básica con R-Commander

    +. 'n el mismo aula anterior# se pesan a los mismos diezalumnos. 5os pesos en ,ilogramos son los siguientes@ M#

    D8# 9

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    66/125

    Estadística básica con R-Commander

    de naturaleza bien di$erenciada# cuya utilización debe apoyarseen argumentos métricos sólidos# tal como se e?puso en el

    capítulo anterior.Revisemos cómo se calcula la mediana en los siguientesejemplos. Supongamos la siguiente secuencia de datos@ +# D# # #9# 9# 9#

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    67/125

    Estadística básica con R-Commander

    5a mediana no est! a$ectada por el error# y contin=a siendo

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    68/125

    Estadística básica con R-Commander

    todos los n=meros que vienen por de$ecto# dejando solamenteE.

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    69/125

    Estadística básica con R-Commander

    7ara practicar la mediana# intente realizar los siguientesejercicios@

    ). 5os salarios anuales 3en euros: de los je$es de ventas deuna empresa peque6a son@ +

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    70/125

    Estadística básica con R-Commander

    clase de la variable que separa a los datos en dos grupos# uno detama6o ) y otro de tama6o +. 'l cuartil * es el valor o clase

    de la variable que separa los datos en un grupo de * y otro de*. 'n este caso# se puede observar que los grupos son iguales.e %ec%o# el cuartil * es igual que la mediana. 'l cuartil + es elvalor o clase de la variable que separa al grupo de datos en dospartes# una de tama6o + por abajo y otra de ) por encima .

     Imagen 14. C(lculo de los cuartiles

    7ara calcular los cuartiles se procede de $orma similar a lamediana. Se ordenan los datos de menor a mayor# yposteriormente se recuentan los datos %asta llegar al punto dondeencontramos )# * o + del total de n=mero de datos. 5osvalores o clases de las variables correspondientes a dic%os puntosnos dar!n el cuartil ) 3):# cuartil * 3*: y el cuartil + 3+:respectivamente.

    'l c!lculo de los cuartiles en R-Commander es como en lamediana@ 'stadísticos# Res=menes y Res=menes de datos. 1os

    '

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    71/125

    Estadística básica con R-Commander

    aseguraremos de que en la ventana de di!logo est! seleccionadala opción EcuantilesF y que est!n todos los valores que vienen

    escritos por de$ecto 38# .*

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    72/125

    Estadística básica con R-Commander

    cuadro escribiremos .++ y .9D# separados por una coma y conatención a poner delante el EpuntoF que indica que es un valor

    decimal 3imagen )

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    73/125

    Estadística básica con R-Commander

     (oda5a moda es el valor o clase de la variable que m!s se repite entrelos datos. ic%o de otra $orma# es el valor que m!s $recuenciatiene. 'ntre las propiedades de la moda destacan las siguientes@

     – 5a moda no tiene porque ser =nica.

     – 's aplicable a cualquier nivel de medida.

    7or ejemplo# la moda de estos datos@ +# D# # # 9# 9# 9# < y )8 es 9puesto que es el valor que m!s se repite 3tres veces:.

    'n el caso de la siguiente secuencia de datos +#

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    74/125

    Estadística básica con R-Commander

     Imagen 1%. asar una #ariable numrica a categ&rica

    'l procedimiento ser! por tanto# asegurar que la variable escategórica# ir al men= E'stadísticosF# elegir ERes=menesF y pedir

    la Eistribución de $recuenciasF. 'l resultado aparece en laventana de resultados# aunque con un $ormato poco atractivo. 'nel ejemplo de la imagen )9# la moda es el valor o clase 8# quecuenta con **9 datos# mientras que el valor ) cuenta solamentecon ))*.

     Imagen 19. recuencias

    1

    http://0.0.0.0/http://0.0.0.0/

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    75/125

    Estadística básica con R-Commander

    Intente realizar los siguientes ejercicios con R-Commander@

    ). 'n unas elecciones se presentan los candidatos 0# "# C y

    . 'n las votaciones# el recuento $ue@ 0# 0# 0# "# C# 0## C# C# "# "# 0# C# # # # "# 0# "# 0# "# "# C# C# ## 0# # C. uién $ue el candidato ganadorT 3Solución@0 con 9 votos:.

    *. 'n unos grandes almacenes %an puesto a la venta cuatro jerseys iguales pero de distinto color. 5os propietariosdel almacén quieren averiguar cual es el jersey que m!sse vende para solicitar una mayor cantidad a losproveedores. 5as ventas durante el día $ueron@ RQ>Q#02/5# K'R'# RQ>Q# RQ>Q# K'R'# RQ>Q# RQ>Q#02/5# 02/5# 02/5# RQ>Q# 02/5# RQ>Q# RQ>Q#K'R'# RQ>Q# RQ>Q# 02/5# 02/5# RQ>Q 3Solución@Rojo:.

    +. 'n un jardín bot!nico intentan averiguar cu!l es la plantaque m!s se adapta al invernadero en $unción de las que

    %an sobrevivido al invierno. 'n una línea de plantaciónse encuentran las siguientes@ 'R01IQ# RQS05#>02(1# 'R01IQ# 'R01IQ# RQS05# 'R01IQ#'R01IQ# RQS05# RQS05# >02(1# 'R01IQ#RQS05# >02(1# >02(1# >02(1# >02(1#'R01IQ# >02(1# RQS05# RQS05 3Solución@ 1o%ay moda:.

    . /n nadador realiza respiraciones cada cierto n=mero de

    brazadas. ueremos calcular la moda de dic%asrespiraciones en un trayecto de

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    76/125

    Estadística básica con R-Commander

    )# *# < # D# ;# ))# M# +# 9# ))# )8# ;# *# +# )8# + 3Solución@+:.

     Rango o am#litud'l rango o amplitud es el recorrido que e?iste entre los datose?tremos. Se calcula restando el valor o clase m!s bajo al m!salto. Se trata de un estadístico que indica la dispersión de losdatos que puede aplicarse a todos los niveles de medida e?ceptoel nominal. 5a in$ormación que aporta es muy limitada# adem!sde verse muy a$ectado por los datos e?tremos. 7recisamente#para evitar este problema con los datos peri$éricos# se sueleutilizar el Rango Intercuartílico 3IR:. Qperativamente el IR esla di$erencia entre el tercer y primer cuartil.

    7ara calcular el rango en R-Commander debemos %acerlo casi de$orma artesanal. R-Commander nos o$rece el m!?imo y elmínimo y después realizamos la resta Ea manoF. 7ara realizar lasustracción basta con escribir en la ventana de instrucciones deR-Commander las operaciones directamente# en este casom!?imo-mínimo# y pulsar el botón de ejecutar.Supongamos que un $rutero# a lo largo del a6o# %a cambiado elprecio de sus tomates@ * euros,g# ) euro,g# *#

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    77/125

    Estadística básica con R-Commander

    . 5os salarios de cuatro trabajadores de una empresa son@988euros# )*88euros# ))88euros# )M88euros. Calcula el

    rango de estos salarios 3Solución@ ;88:.

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    78/125

    Estadística básica con R-Commander

    )arianza * desiación t+#ica5a varianza o variancia es un indicador de dispersión que secalcula como el promedio del cuadrado de las di$erencias de lasobservaciones respecto a su media 3e?presión *:.

    6 "

    *=∑ ( "i− D  )*

    n 3'?presión *:

    5a desviación típica es otro estadístico de dispersión quecorresponde con la raíz cuadrada de la variancia. 0mbosestadísticos se utilizan para variables cuantitativas 3niveles demedida de intervalos o de razón:.

    'l c!lculo en R se %ace a través del men= de E'stadísticosF#submen= ERes=menesF y pulsando en ERes=menes numéricosF.Se abre la ventana de di!logo y elegimos la opción EesviacióntípicaF. e esta $orma obtenemos la desviación. "astar! con

    elevarla al cuadrado para tener la varianza. Hambién se puedecalcular directamente escribiendo en la ventana de instruccioneslo siguiente@

    #ar0datos;sd0datos;

    5os comandos se corresponden con varianza y desviación típicarespectivamente. 5os resultados aparecer!n en la ventana de

    resultados.Realice los siguientes ejercicios para practicar el proceso@

    ). 5as presiones arteriales sistólicas de tres pacientes son@)8# )+8# )98. Calcular la varianza y la desviación típicade dic%as presiones 3Solución@ varianzaM y desviacióntípica *.D

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    79/125

    Estadística básica con R-Commander

    reciben mensualmente. 5os datos obtenidos son lossiguientes@ )888 euros# 988 euros# )

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    80/125

    Estadística básica con R-Commander

     Imagen 8. ?arian!a ) des#iaci&n t'ica

    Coeficiente de ariación's un estadístico de dispersión carente de dimensiones. Secalcula como el cociente de la desviación típica entre el valorabsoluto de la media. 'sto lo convierte en el indicador de

    dispersión ideal para comparar elementos de distinta naturaleza oprocedentes de distintas $uentes. e esta $orma podemos ver siun grupo de personas es m!s %omogéneo en renta que enactitudes# o en altura que en consumo# etc. Hambién permitecomparar grupos de distinta procedencia.

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    81/125

    Estadística básica con R-Commander

    7or ejemplo# dos médicos est!n realizando dos estudios sobre laestatura de la población $emenina en dos provincias distintas#

    obteniendo los siguientes resultados estadísticos@'studio )@

    (edia)8 cm

    esviación típica*9.*9 cm

    'studio *@

    (edia)

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    82/125

    Estadística básica con R-Commander

    'ste estadístico se calcula a través del men= E'stadísticosF#dentro del submen= ERes=menesF# en las opciones de

    ERes=menes numéricosF. Hambién se puede calcular de $ormaEartesanalF# a partir de la media y la desviación típica. 7ara ellonecesitamos utilizar los operadores 3dividir: y 3multiplicar:. 'nel ejemplo anterior# realizaríamos las operaciones en la ventanade instrucciones de R-Commander y pulsaríamos en ejecutar3imagen *):.

     Imagen 1. Coe-iciente de #ariaci&n

    0ntes de continuar trate de realizar los siguientes ejercicios@

    ). Henemos dos equipos de $=tbol y los siguientes datos@

    oles a $avor del equipo local 0 en los =ltimos 9partidos@

    5

    http://0.0.0.0/http://0.0.0.0/

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    83/125

    Estadística básica con R-Commander

    *#)#8#8#)#*#)#8

    media8.9M<

    desviación típica8.9+

    oles a $avor del equipo local " en los =ltimos 9partidos@

    +#8#8#*#)#)#8#8

    media8.9M<

    desviación típica).)*

    Cual de los dos equipos presenta un mayor coe$icientede variaciónT 3Solución@ CK0;

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    84/125

    Estadística básica con R-Commander

    menos de )8 tienen una dispersión mayor relativa de*9.;

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    85/125

    Estadística básica con R-Commander

    7ara %acer el gr!$ico en R-Commander vamos al men=Er!$icasF y se elige Er!$ica de sectoresF. Se abre una ventana

    donde podemos elegir# de entre la variables categóricas# las quenos interesen y pulsamos aceptar.

     Imagen .

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    86/125

    Estadística básica con R-Commander

    discretas# incluyendo a todas las variables medidas a nivelnominal u ordinal# adem!s de variables de intervalo o razón que

    también sean discretas 3imagen *+:.

     Imagen 3. +iagrama de barras

    )isto!rama

    's una representación en columnas# de variables continuas. 7araconstruirlo se parte de la división del rango de la variable enintervalos de igual amplitud. 'l anc%o de la columna del gr!$icose corresponde con dic%a amplitud# mientras que el alto de lamisma representa la $recuencia del intervalo. e esta $orma# el!rea de la columna es proporcional al intervalo y a la $recuenciaabsoluta o relativa de la variable.

    3

    http://0.0.0.0/http://0.0.0.0/

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    87/125

    Estadística básica con R-Commander

    Se utiliza para representar variables medidas a nivel de intervaloo de razón que sean continuas.

    'n R-Commander# cuando elegimos el gr!$ico EGistogramaF seabre una ventana donde podemos eligir si queremos larepresentación de las $recuencias# de los porcentajes# o de lasproporciones 3densidades: tal como se puede observar en laimagen *.

     Imagen 4. Men/ del 7istograma

    *ia!rama de cajas

    'ste gr!$ico también se llama de bigotes o de Hu,ey 9. Se trata deuna caja central cuyos límites indican el

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    88/125

    Estadística básica con R-Commander

    que salen de la caja 3en $orma de bigotes: son los valores quelimitan el ;

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    89/125

    Estadística básica con R-Commander

     Autoealuación).- 7ara describir un grupo de datos deben utilizarse lossiguientes estadísticos

    0: 'stadísticos de $orma y dispersión

    ": 'stadísticos de posición y dispersión

    C: 'stadísticos de in$erencia y dispersión

    R'S7/'SH0@ "

    *.- 7ara datos categóricos podemos usar el siguiente estadísticode posición

    0: (edia

    ": (oda

    C: Rango

    R'S7/'SH0@ "

    +.- 'n R-Commander# la media se encuentra en el men=

    0: atos

    ": Res=menes

    C: r!$icas

    R'S7/'SH0@ "

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    90/125

    Estadística básica con R-Commander

    .- 'n la salida de resultados de R-Commander# la mediana seindica con la siguiente palabra

    0: (edian

    ": (ean

    C: (eda

    R'S7/'SH0@ 0

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    91/125

    Estadística básica con R-Commander

    9.- 7ara calcular directamente la varianza de una variabledebemos utilizar el siguiente comando

    0: var3variable:": sd3variable:

    C: sd*3variable:

    R'S7/'SH0@ 0

    ;.- /na variable discreta medida a nivel de intervalos se puederepresentar mediante la siguiente gr!$ica

    0: iagrama de barras": Gistograma

    C: iagrama de dispersión

    R'S7/'SH0@ 0

    )8.- 5a línea central que aparece en el diagrama de Hu,eycorresponde con

    0: 'l cuartil )": 5a media

    C: 5a mediana

    R'S7/'SH0@ C

    4

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    92/125

    Estadística básica con R-Commander

     Actiidades7ara la realización de las siguientes actividades tenga en cuentalo siguiente@

    10 dato no disponible.

    5os datos proceden de los paquetes de datos que incluyeR al instalarse.

    5as matrices que aquí se presentan no est!n completas.

    Realice el an!lisis# copie los resultados de salida einsértelos en un documento de te?to.

    'l documento resultante es una %erramienta b!sica parapoder redactar los in$ormes de investigación 3artículos#comunicaciones# ponencias# etc.:.

    ).- 0 continuación se incluye parte de los datos de una encuestasobre intención de voto en C%ile. 0 partir de la siguiente matrizde datos calcule los estadísticos de posición correspondientes.

    sex a!e education income vote

    ) ( D< 7 +

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    93/125

    Estadística básica con R-Commander

    5eyenda@

    ( Gombre

    4 (ujerS@ 'ducación secundaria7@ 'ducación 7rimaria7S@ 'ducación superior.0# 1# /# N@ istintos partidos políticos

    *.- 5os siguientes datos corresponden al registro de la Sociedad0mericana de (atem!ticas. Realice un estudio de estadísticos deposición y de dispersión de todas las variables.

    Orden t+pe sex citi,en count

    ) I37u: (ale /S )+** I37u: 4emale /S +<+ I37r: (ale /S 9M I37r: 4emale /S *8< II (ale /S ;DD II 4emale /S M

    M III (ale /S M9 III 4emale /S +*; IK (ale /S M)

    )8 IK 4emale /S

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    94/125

    Estadística básica con R-Commander

    +.- 0 continuación se presenta un matriz de datos con los

    registros de pacientes de c!ncer. 'n la matriz se incluyen datoscomo el se?o# edad# días desde el diagnóstico# etc.# así comoindicadores $isiológicos. Realizar un an!lisis descriptivocompleto# incluyendo estadísticos de posición# de dispersión ygr!$icos correspondientes. 5as variables p%.ecog# pat.,arno#meal.cal# &t.loss son indicadores médicos.

    inst time status a!e sex p-$eco!

    p-$.arno

    /at$.arno

    Meal$cal

    wt$loss

    + +8D * M ) ) ;8 )88 ))M< 10

    +

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    95/125

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    96/125

    Estadística básica con R-Commander

    ".- Introducción al análisis correlacionalcon RObjetivos:

     – Conocer los conceptos de correlación y regresión.

     – i$erenciar entre relación y causalidad.

    Cuando termine deberá:

     – Realizar el an!lisis de correlación lineal con R-Commander.

     – Conte?tualizar la relación y la relación causal.

     Introducción0ntes de comenzar trate de ver este vídeo en Noutube@

    %ttp@&&&.youtube.com&atc%Tvpg+01j+i?C&'n los ane?os a este capítulo se %an dejado otros enlaces dedocumentales en la red 3a $ec%a diciembre de *8)*: sobre elmismo tema.

    'n el documental nos encontramos la tesis de aquellos colectivosque a$irman que e?iste un proceso de cambio clim!ticopropiciado por la actividad contaminante de la espacie %umana.5a %ipótesis de partida es que# en los =ltimos siglos# el cambioclim!tico se %a acelerado debido a la emisión de gases emanadosde la actividad %umana# que propician el e$ecto invernadero.

    Si lo e?presamos de $orma operativa tendremos lo siguiente@

     – 5a actividad del ser %umano emite gases.

     – 'stos gases propician el e$ecto invernadero.

     – 'l e$ecto invernadero provoca un aumento r!pido de la

    43

    http://www.youtube.com/watch?v=pg3ANj3ixCwhttp://www.youtube.com/watch?v=pg3ANj3ixCw

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    97/125

    Estadística básica con R-Commander

    temperatura de la Hierra.

    7or tanto@

     – 5a actividad %umana provoca un aumento r!pido de latemperatura de la Hierra.

    7ara que lo =ltimo sea correcto debe ser cierto que la actividadcotidiana de la %umanidad provoca gases. Hambién debe sercierto que entre estos# e?isten gases que $avorecen el e$ectoinvernadero# y debe ser cierto que el e$ecto invernadero aumenta

    la temperatura global de la Hierra.7or tanto# antes de nada# y antes de valorar la causalidad de unavariable sobre otra# nos interesa analizar si realmente e?istealguna relación entre todos estos $enómenos.

    'ste proceso deductivo nos lleva a un punto muy interesante conrelación al cambio clim!tico. Si encontramos alg=n tipo derelación entre el aumento de la actividad %umana y el aumento de

    temperatura podremos a$irmar que de alguna $orma# una de lasvariables in$luye sobre la otra. Sin embargo# si encontramos uncambio de la temperatura en EausenciaF de cambios en laactividad %umana# querr! decir que una no in$luye sobre la otra.

    'n resumen# estas son las dos posiciones actuales al respecto@

     – e$ensores de la %ipótesis del cambio clim!tico porculpa de la emisión de gases procedente de la actividad%umana. 'stos grupos de$ienden que a medida que el

    %ombre %a emitido m!s gases# como consecuencia delaumento de la industria# los motores de combustión# etc.#se %a registrado un aumento dr!stico de la temperaturaglobal. Sin embargo# no pueden todavía demostrar$ormalmente que dic%a relación sea causal# aunquepresentan modelos biológicos co%erentes.

    4#

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    98/125

    Estadística básica con R-Commander

     – e$ensores de que no e?iste esta relación causal. 'stosgrupos lo que %acen es buscar periodos %istóricos donde

    la actividad %umana no era tan importante como paraemitir gases de $orma masiva. 7ara ello# se remontan aregistros geológicos# estudiando periodos de milenios.e esta $orma presentan registros donde se observanciclos periódicos de aumento y disminución de latemperatura global. Su %ipótesis es que dic%os cambiosson debidos a otras circunstancias# ya que el ser %umanoen esos siglos no tenía industria contaminante.

    0l margen de la simpatías personales %acia una u otra postura# loque aparece como una pieza importante para valorar laplausibilidad de dic%as posiciones es el estudio de la relaciónentre dos variables clave@ emisión de gases y temperatura global.1o solamente es b!sico qué papel tienen dic%as variables en todoeste debate# sino adem!s# cómo se miden y desde cuando semiden.

    7ues bien# el estudio de las EcorrelacionesF o$rece %erramientasimprescindibles para analizar esta situación.

    Correlación con R-Comannder 7ara analizar la correlación entre variables e?iste un amplioarsenal de técnicas que se adaptan a las distintas característicasde una investigación. 7r!cticamente todos los procesos analíticospretenden reducir la relación entre variables a un coe$iciente que

    se interpreta seg=n su valor numérico# su signo 3positivo onegativo:# el nivel de signi$icación# y en algunos casos# por elcuadrado del coe$iciente@

     – Coe$iciente de correlación@ es un n=mero que indica la$uerza de la relación entre las variables. 'l valor puedeoscilar entre 8 y m!s o menos ). 5os valores cercanos a 8indican baja relación y los cercanos a ) 3tanto positivocomo negativo: relación alta.

    4'

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    99/125

    Estadística básica con R-Commander

     – Signo del coe$iciente@ Si el signo del coe$iciente decorrelación es negativo indica que la relación entre

    variables es inversa# mientra que si es positivo# larelación es directa. 7or ejemplo# en un estudio entrealimentación y salud obtenemos un signo positivo en elcoe$iciente. Concluimos por tanto# que una mejoralimentación est! relacionada con una mejor salud 3amejor alimentación# mejor salud y viceversa:. 7or elcontrario# si en un estudio se obtiene una relaciónnegativa entre %iperactividad y rendimiento académico#

    esto indica que a mayores niveles de %iperactividad#menor rendimiento académico# y viceversa.

     – 1ivel de signi$icación@ esto es necesario cuando sequieren establecer in$erencias sobre la población a partirde la muestra. 5a signi$icación es una $orma de analizarsi la relación entre las variables es azarosa o por elcontrario# la relación es resultado de una situaciónestructural.

     – Cuadrado del coe$iciente@ se conoce como coe$iciente dedeterminación. 's una $orma de indicar la cantidad devarianza que comparten dos variables.

    /na de las $ormas de comenzar el an!lisis correlacional entre dosvariables consiste en realizar un gr!$ico bivariante# y %acer unavaloración visual. 7or ejemplo# en un investigación se %a

    recogido in$ormación sobre dos dimensiones 3motivación ycali$icación:. Se %an ordenado las puntuaciones obtenidas yposteriormente se %an representado en un gr!$ico de dispersión3imagen *D:.

    4

    http://0.0.0.0/http://0.0.0.0/

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    100/125

    Estadística básica con R-Commander

     Imagen $.

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    101/125

    Estadística básica con R-Commander

     Imagen %. ?entana de di(logo ara los gr(-icos de disersi&n D@ 

    'n R-Commander el proceso de an!lisis se puede iniciarrealizando una gr!$ica de dispersión donde valorar visualmente larelación. 7ara ello# una vez que se tiene la matriz de datos

    cargados# se pulsa en el men= Er!$icasF. e todas lasposibilidades se elige Er!$ica NF. Se abre una ventana dedi!logo# donde pulsamos en las dos variables que nos interesan

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    102/125

    Estadística básica con R-Commander

    modi$icar ninguna de las opciones del restos de la ventana dedi!logo. 7ulsando aceptar se abrir! el gr!$ico en una nueva

    ventana.

     Imagen 9. Cur#a de aro"imaci&n

    'n este caso se %a utilizado para el ejemplo# los datos de lamatriz EcgdF disponible en el paquete de datos EsurveyF que seinstala con R. 'n la curva podremos valorar si la distribución que

    aparece podría representarse mediante una $igura matem!ticaconocida 3recta o curva entre otras:.

    45

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    103/125

    Estadística básica con R-Commander

     Imagen B. roceso gr(-ica de disersi&n D@ 

    7ara obtener el coe$iciente de correlación de 7earson nosdirigimos al men= E'stadísticosF. Se elige ERes=menesF y dentrodel mismo la opción E(atriz de correlacionesF. 'n la ventanaque se abre se eligen las dos variables que nos interesa# pulsandola tecla de EcontrolF al mismo tiempo que con el ratón pulsamossobre las variables 3CtrlUratón:. 'legimos la opción ECoe$icientede 7earsonF y también la opción de Ep-valor pareado de lascorrelaciones de 7earson o SpearmanF. e esta $orma tendremosel coe$iciente de correlación de 7earson y el valor de

    signi$icación del mismo.'l resultado aparece en la ventana de resultados de R-Commander# con un aspecto algo burdo pero con todos losindicadores de interés.

    5*

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    104/125

    Estadística básica con R-Commander

     Imagen 38. Men/ de correlaciones

    'l siguiente paso es la interpretación de los resultados@

     – 'n principio la gr!$ica de dispersión mostraba que ladistribución de puntos $ormaban una banda parecida a

    una recta al principio que iba curv!ndose al $inal3imagen *9:. 'sto %ace sospec%ar la e?istencia de algunarelación entre las dos variables.

     – 'l coe$iciente de correlación de 7earson %a indicado unacorrelación de 8.9+. 7uesto que la correlación de 7earsonse mueve entre 8 y )# es de suponer que la relación esimportante.

     – 'l nivel de signi$icación es de 8# lo que indica que larelación no es casual;. 

     – 7or =ltimo# el signo positivo del resultado 3U8.9+: indicaque la relación es directa# es decir# que cuando aumentauna variable aumenta la otra.

    5 (a sinificaci)n de $n res$ltado se establece a partir de $ncontraste de hip)tesis, c$esti)n $e se de0a para $n se$ndool$men. En este caso amos a admitir como cierto $e $n

    alor p menor o i$al a *.*' indica $e la relaci)n no es cas$al.

    51

    http://0.0.0.0/http://0.0.0.0/http://0.0.0.0/http://0.0.0.0/http://0.0.0.0/

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    105/125

    Estadística básica con R-Commander

     Imagen 31. Resultados de la correlaci&n

    ueda un =ltimo elemento# el coe$iciente de determinación. 'stecoe$iciente es el cuadrado del coe$iciente de correlación y enprincipio no lo calcula el método que %emos presentado 3%ayotras $ormas de analizar la correlación en R que sí lo calculan:.'n el ejemplo# el coe$iciente de determinación es 8.D99# quepuede e?presarse como porcentaje indicando que el D9.9A de lavariabilidad total de ambas variables es com=n.

    'l coe$iciente de determinación se puede interpretar tambiéncomo un indicador de la bondad de ajuste del modelo a larealidad de los datos. 's decir# valorar si la $igura que se %a

    elegido para representar la nube de puntos es aceptable o no.'n el ejemplo que se %a ido describiendo# parece que una recta esbastante buena# de %ec%o el resultado indica que el valor deajuste es de 8.9+ lo que implica una variabilidad e?plicada delD9.9A. 1o obstante# si se usase un arco tal vez se obtuviese unmejor ajuste. 'ste proceso de b=squeda del mejor modelo tiene aveces# m!s de arte que de estadística.

    52

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    106/125

    Estadística básica con R-Commander

     Imagen 3. Resumen correlaci&n

     Regresión con RCuando se comprueba que dos variables mantienen una relaciónentre sí# podría sospec%arse que una de ellas es la causa de laotra. 'videntemente# no basta con tener un alto coe$iciente de

    correlación para aventurarse a decir que una variable esconsecuencia de otra. 1ormalmente se tienen m!s indicios# porejemplo# que una de ellas aparece casi siempre# o siempre# antesde que aparece la otra 3antes de llover siempre %ay nubes en elcielo# tras darnos un golpe aparece el dolor# cuando se comedesaparece el %ambre# etc.:# o por ejemplo# que una de ellas estérelacionada con la naturaleza de la otra 3la producción deelectricidad en un pantano depende de la e?istencia de agua

    53

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    107/125

    Estadística básica con R-Commander

    almacenada en dic%o pantano# los bene$icios de una empresadependen de las ventas de dic%a empresa# etc.:. 'n de$initiva#

    cuando se demuestra la relación entre dos variables y se tienenotros indicios su$icientes# es plausible sospec%ar que dic%arelación es de tipo causal.

    5as técnicas de regresión tratan de generar un modelo $ormal querepresente dic%a relación causal# considerando una variablecomo e?plicada# y la otra como e?plicativa. eneralmente esto see?presa de manera $ormal como sigue@

    K Constante U "eta ? KI U 'rror

    onde@

    K@ es la variable dependiente o e?plicada.KI@ es la variable independiente o e?plicativa."eta@ es el peso que tiene la KI en la ecuación.'rror@ incluye las variaciones que pueden registrarse enla relación entre K y KI de $orma coyuntural.Constante@ es precisamente eso# un valor constante.

    'n el an!lisis de regresión lo interesante es calcular las betas parasaber si las variables e?plicativas o independientes tienen unpeso importante en la e?plicación de la variable dependiente. Silos valores son muy bajos indicar! dos cosas# primero que larelación también es baja 3cuestión ésta que puede %aber quedadoal descubierto al calcular el coe$iciente de correlación:# y

    segunda# que la capacidad e?plicativa de la variable es pocoimportante. 'n resumen# cuando se realiza un an!lisis deregresión %ay que tener en cuenta lo siguiente@

     – Se trata de encontrar un modelo que represente la posiblerelación causal entre una variable y el resto.

     – 'n el an!lisis debemos valorar el peso de las variablese?plicativa y del error.

    5#

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    108/125

    Estadística básica con R-Commander

    'n R-Commander la realización del modelo de regresión esrelativamente simple. esde el men= E'stadísticosF se pulsa en

    E0justes del modeloF y se elige la primera opción# ERegresiónlinealF. Se abre una ventana de di!logo y elegimos una variablecomo e?plicada y una o m!s como variables e?plicativas 3en estevolumen nos estamos limitando a una sola variable:. 0ceptamoslas operaciones y el resultado aparece en la ventana de resultadosde R-Commander.

     Imagen 33. Men/ emergente ara la regresi&n

    'n el resultado obtenemos el peso de las variables e?plicativas3las betas que se comentaban anteriormente:# junto con elcoe$iciente de determinación m=ltiple 3cuyo resultado es similaral coe$iciente de determinación obtenido en la correlación: y las

    características de los errores 3mediana# cuartiles# etc.:. Se incluyetambién el valor de la constante así como los valores designi$icación de cada uno de los componentes.

    5'

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    109/125

    Estadística básica con R-Commander

     Imagen 34. Resultados del modelo de regresi&n

    'l modelo que aparece en la imagen + se puede e?presar de lasiguiente $orma@

    ?+ConstanteFGetaH?IFError

    7eig7tBB.%1F.9HageFError

     Imagen 35. Resumen de regresi&n

    5

    http://0.0.0.0/http://0.0.0.0/

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    110/125

    Estadística básica con R-Commander

    0 partir de este modelo puede estimarse que para un valor deEageF de )9 a6os el resultado de E%eig%tF ser! apro?imadamente

    de )

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    111/125

    Estadística básica con R-Commander

    los datos como para la presentación de los resultados. 5osgr!$icos son accesibles desde el men= Er!$icasF donde

    encontramos distintos submen=s de interés para la correlación yla regresión.

    *ia!rama de dispersión

    'n el submen= del diagrama de dispersión conseguimos unaventana emergente que $acilita la construcción de un gr!$ico dedispersión para dos variables. 'l gr!$ico resultante incluye losgr!$icos de caja que describen cada una de las variables. 4acilita

    también la curva de apro?imación 3calculada por elprocedimiento de mínimos cuadrados: 3imagen +D:.

     Imagen 3%. Matri! de gr(-icos de disersi&n

    54

    http://0.0.0.0/http://0.0.0.0/

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    112/125

    Estadística básica con R-Commander

    Matri, de dia!ramas de dispersión

    'ste gr!$ico es especialmente =til para obtener# al mismo tiempo#

    varios gr!$icos de dispersión por pares de variables. 'n lasopciones del men= emergente se pueden elegir las variables quese analizar!n# así como la inclusión de distintos gr!$icosindividuales# líneas de tendencia# etc. Se trata de un gr!$icoespecialmente =til para realizar una inspección visual previa3imagen +M:.

     Imagen 39.

  • 8/20/2019 Estadistica Basica Con RCommander UNED

    113/125

    Estadística básica con R-Commander

    *ia!rama de dispersión en '*

    Se trata de un gr!$ico que representa la dispersión con tres

    variables al mismo tiempo. 0dem!s de ser muy atractivovisualmente# es especialmente =til porque se trata de un gr!$icointeractivo. /na vez que se %a realizado es posible girar e