Introducción al R Commander

112
Un software de análisis estadístico

Transcript of Introducción al R Commander

Un software de análisis estadístico

INDICE

Introducción Como bajar R Manuales de R Librerías Inicio de Sesión en R Como bajar librerías GUI’s Rcomander

SciViewsR

Un poco de Historia

R es una implementación open-source del lenguaje S (Bell Labs -principios de los 90), que también es la base del sistema S-Plus (entorno comercial).

R y S-Plus aún comparten una gran mayoría de código e instrucciones, pero probablemente serán dos entornos independientes en un futuro a medio plazo.

Las funciones de R se agrupan en paquetes (packages, libraries), los que contienen las funciones más habituales se incluyen por defecto en la distribución de R, y el resto se encuentran disponibles en la Comprehensive R Archive Network (CRAN) http://cran.r-project.org

El entorno R

Suite integrada para la manipulación de datos, cálculo y procedimientos gráficos.

Los principales aspectos que ofrece son: Facilidad para el manejo y el almacenamiento de

datos. Un conjunto de operadores para cálculo con arrays

y matrices. Una colección extensa e integrada de herramientas

intermedias para el análisis de datos. Multitud de facilidades gráficas. Un lenguaje de programación simple y efectivo que

incluye las estructuras de control clásicas, funciones recursivas y facilidades para el input y output de datos y resultados.

El entorno R

R es un entorno altamente dinámico, y a menudo se concibe como un vehículo para desarrollar (nuevos) métodos interactivos de análisis de datos

Ventaja: incorporación constante de nuevos métodos.

Inconveniente: por su dinamismo, a menudo código antiguo de R se queda desfasado y no funciona con las nuevas versiones del entorno.

Como bajar R?

Como bajar R Acceder a la pagina del proyecto R (http://www.r-project.org) Pinchar en CRAN (Comprehensive R Archive Network )

Como bajar R

Pinchar en el Mirror de Spain (Spanish National Research Network, Madrid )

http://cran.es.r-project.org/

Como bajar R Pinchar en Windows(95 and later)

Como bajar R Pinchar en base

Como bajar R Botón derecho y guardar el ejecutable R-2.6.0-win32.exe

Manuales de R

Manuales de R Pinchar en Contributed

Manuales de R

Librerías

El sistema de librerías

Una librería o paquete es un conjunto de funciones sobre una temática común. El sistema R-base trae las librerías diseñadas por el núcleo central de desarrolladores (core). Sin embargo, el modelo descentralizado de producción de R conlleva que muchas funciones interesantes no se instalen con el paquete básico sino que estén contenidas en paquetes o librerías externas que hay que instalar por separado. Aunque son descargables desde muchos sitios de internet, se recomienda su descarga desde el repositorio Comprehensive R Archive Network (CRAN) porque se garantiza que su funcionamiento ha sido revisado y aprobado por el núcleo de desarrolladores.

Librerías Pinchar en Packages

Librerías

>650

Librerías

Epi Contiene modelos Edad-Periodo-CohorteEpitools Ajustar tasas

Librerías

R 2.4.1.lnk

Inicio de Sesión

Inicio de Sesión

Tras arrancar el programa, aparece una ventana titulada R Console que indica la versión de R y cómo obtener información de la licencia de uso.

Ventana de ordenes

Archivo Operaciones básicas con los ficheros.

Editar Típico menú con opciones de edición (copiar, pegar, ...).

Misc Opciones avanzadas. Paquetes Permite gestionar los paquetes

adicionales de R. Ayuda Información abundante sobre R.

Como bajar librerías?

Como bajar Librerías

Paquetes Seleccionar Austria Ok

Como bajar Librerías

Paquetes Instalar paquetes Escoger el paquete que se quiere instalar Pulsar Ok

Como bajar Librerías

o Bajar el fichero en .Zip y después cargarlo desde Local

Como bajar Librerías

Paquetes Instalar paquetes a partir de archivos zip locales Se busca el directorio desde se guarda el archivo Abrir

Como cargar Librerías

o Una vez instalada la librería hay que cargarla.

o Paquetes Cargar paquete (s)

Notas:

Cada 3 meses aparece una nueva versión de R Reinstalarlo cada 6 meses

Hay librerías que funcionan a partir de una determinada versión de R

Ayuda de R

Ayuda de R

Ayuda de R

Ayuda de R

Ayuda R

Ayuda de R

Ayuda de R

Ayuda R

? mean help.search("mean") Busca en los

paquetes donde aparece la palabra mean

apropos("mean") Funciones donde aparece la palabra mean

GUI’s

GUI's

El hecho que R no tenga los menús para seleccionar funciones como tienen algunos otros sistemas de análisis estadístico puede hacer que resulte complejo su uso al principio.

Se han desarrollado varios GUI (Graphical User Interface) que ayudan al principio a irse familiarizandose con el lenguaje, aún a costa de perder flexibilidad

GUI's

Algunos de ellos son los siguientes:

Rcomander: Se instala a través de la librería Rcmdr

SciViewsR: Disponible desde el 2 de abril de 2005 . Esta interfaz grafica de R se asemeja a la que utiliza el programa SAS que divide la ventana en 3 secciones

Una para edición de sintaxis Una para visualizar resultados Una tercera para navegar por los objetos y

funciones).

SciViewsR

Requiere los siguientes pasos previos:

El programa R instalado y funcionando, el Rgui debe estar en modo sdi (Edit/Gui preferences/sdi, y salvar) hay que cerrar y volver a abrir el programa para que se apliquen los cambios.

Descargar e instalar sciViews-R_0.7-3Setup.exe , aceptando los iconos en el escritorio y en el menu de inicio.

Una vez instalado tenemos que entrar en la carpeta donde se ha instalado SciViews y modificar las propiedades del acceso directo a sciViews-R (boton derecho del mouse/propiedades/ en donde dice destino debe quedar reflejado el camino a Rgui.exe y las opciones que se describen abajo así:

"C:\Archivos de programa\R\rw2010pat\bin\Rgui.exe" --sdi RSciViews.RData

http://www.sciviews.org/SciViews-R/index.html

SciViewsR

http://www.sciviews.org/SciViews-R/

SciViewsR R Commander

ExploradorEditor de Sintaxis

Reference card

Librería Rcmdr

Ejecutar R En el menú Paquetes, pinchar en

Seleccionar espejo CRAN. En el cuadro de dialogo, escoger

Austria y pulsar en Aceptar En el menú Paquetes, pinchar en

Instalar paquetes Escoger Rcmdr y aceptar

Librería Rcmdr

En el menú Paquetes, pinchar en Cargar paquetes y seleccionar Rcmdr

También poniendo en la línea de comandos library(Rcmdr)

R Commander

Maximizamos

R Commander

Barra de Menús, con desplegables

Datos activos, Modelo Activo, Visualizar datos, Editar datos

Contiene aquellas salidas de las órdenes ejecutadas quese muestran en formato de texto.

Muestran las órdenes de R correspondientes a las opciones de los menús escogidas por el usuario. Además, tales instrucciones se pueden modificar, y ejecutar mediante el botón Ejecutar.

Barra de menús

Fichero: Hay opciones para cargar o grabar instrucciones, resultados o el entorno de trabajo.

Editar: Típico menú de edición. Permite seleccionar, cortar, copiar, pegar y buscar.

Datos: Permite la gestión de los datos por analizar. R mantiene distintos conjuntos de datos dentro del entorno de trabajo.

Estadísticas Recoge los diferentes métodos de análisis que se pueden aplicar al conjunto de datos activo.

Modelos Un conjunto de datos puede tener asociados varios modelos estadísticos. Este menú sirve para la gestión de los mismos.

Distribuciones Para trabajar con funciones de distribución de probabilidad: cuantiles, probabilidades y gráficas asociadas a las distribuciones normal, t, Chi^2, F, binomial. . .

Ficheros .R

Es simplemente un fichero de texto que contiene órdenes. Es posible escribir órdenes directamente en la ventana.

Sin embargo, es más sencillo permitir que el programa le ayude a construir un guión aprovechando que la realización de una acción desde un cuadro de diálogo añade la orden a la ventana de guiones.

En ésta puede ser modificada para su posterior ejecución. Para ello, ha de seleccionar con el ratón la orden u órdenes y después ha de pinchar el botón derecho del ratón en Ejecutar.

Fichero

Ventana de instrucciones

En el cuadro de diálogo de un procedimiento determinado, pulse en el botón Ayuda para saber qué opciones del lenguaje R están disponibles (si hay alguna) para ese procedimiento.

Si desea información completa sobre el lenguaje de órdenes, consulte el manual de referencia incluido con la documentación de R.

Ventana de instrucciones

Ventana de resultados Una vez que se solicita un análisis con los datos, los resultados

obtenidos se muestran en la ventana inferior. El texto en rojo son las órdenes correspondientes que aparecen

en la ventana de instrucciones. El texto en azul es el resultado de cada orden. Los contenidos de la ventana de resultados son texto puro, que

puede ser copiado a cualquier editor de texto para su procesamiento.

Ventana de resultados

Podemos usar las ventanas de instrucciones y resultados a manera de calculadora. El lenguaje R permite las operaciones aritméticas básicas, la definición de variables y funciones y dispone de una colección muy extensa de funciones ya definidas. En el siguiente, definimos la función varianza:

muestra <- c(1,3,5,7,33)

mean(muestra)

varianza <- function(x) {mean(x^2) - mean(x)^2}

varianza (muestra)

Ventana de resultados

Manejo de datos

Aprenderemos a manejar los conjuntos de datos y a leer y almacenar en un fichero los datos necesarios para realizar un análisis. Estas tareas se realizan a través del menú Datos.

Nuevos datos Para introducir nuevos datos por el teclado.

Importar datos Para leer datos contenidos en un fichero.

Datos en paquetes R contiene una colección de datos de ejemplo.

Datos activos Aquí se gestiona el conjunto de datos activo.

Modificar variables de los datos activos Para realizar trasformaciones en los datos.

Manejo de datos

Manejo de datos

Ir a la ayuda para en Html

Manejo de datos

Manejo de datos

Si pinchas en Datos Puedes seleccionar los datos que te interesen

UN pasa a ser la base de datos activa

Manejo de datosBarra de elementos activo

Datos Nombre del conjunto de datos activo, es decir,el que se toma por omisión a la hora de ejecutar una orden.

Editar datos Hace aparecer una cuadrícula donde es posible modificar el contenido del conjunto actual de datos.

Visualizar datos Muestra el contenido del conjunto actual de datos.

Modelo Para un mismo conjunto de datos se pueden crear diferentes modelos de análisis (de regresión lineal, de componentes principales...). Este menú permite escoger el modelo activo, es decir, aquel considerado por omisión cuando se ejecuta una orden.

Manejo de datosBarra de elementos activo

Manejo de datosCreación de un conjunto de datos nuevos

Nombre del conjunto de datos

Manejo de datos

Para introducir los datos simplemente se coloca el cursor en la celda correspondiente a cada individuo y variable. Para moverse de una celda a otra se puede utilizar el ratón, o las teclas del cursor y retorno para el desplazamiento vertical, o las teclas del cursor y tabulador para el desplazamiento horizontal.

Al introducir los datos, se observa que R da por omisión nombre a las variables (var1, var2, ...)y define sus características. En principio, una variable puede ser numérica (numeric) o de caracteres (character). Si se desea cambiar el nombre o definir el tipo de variable hay que pulsar en la cabecera de la columna correspondiente.

Llamaremos factores a las variables de caracteres. Nos servirán para representar variables cualitativas, es decir, aquéllas cuyo valores toman un número finito de modalidades.

Manejo de datosImportar datos de un fichero externo

Manejo de datos

Observamos que no tenemos nombre de variable porque se lo hemos indicado así, ya que el fichero no disponía. Y que solo tiene una variable

Manejo de datos

Manejo de datos

Manejo de datos

Hombres <- read.table("C:/Documents and Settings/pina/Escritorio/R/Castellano/TA1_1.prn", header=FALSE, sep=",", na.strings="NA", dec=".", strip.white=TRUE)

Hombres$PR <- with(Hombres, substr(V1,1,2)) Hombres$COM <- with(Hombres, substr(V1,3,4)) Hombres$MUNI <- with(Hombres, substr(V1,5,7)) Hombres$DT <- with(Hombres, substr(V1,8,9)) Hombres$SEC <- with(Hombres, substr(V1,10,12))

Hombres$P00_04 <- with(Hombres, substr(V1,13,20)) Hombres$P05_09 <- with(Hombres, substr(V1,21,28)) Hombres$P10_14 <- with(Hombres, substr(V1,29,36)) Hombres$P15_19 <- with(Hombres, substr(V1,37,44)) Hombres$P20_24 <- with(Hombres, substr(V1,45,52)) Hombres$P25_29 <- with(Hombres, substr(V1,53,60)) Hombres$P30_34 <- with(Hombres, substr(V1,61,68)) Hombres$P35_39 <- with(Hombres, substr(V1,69,76)) Hombres$P40_44 <- with(Hombres, substr(V1,77,84)) Hombres$P45_49 <- with(Hombres, substr(V1,85,92)) Hombres$P50_54 <- with(Hombres, substr(V1,93,100)) Hombres$P55_59 <- with(Hombres, substr(V1,101,108)) Hombres$P60_64 <- with(Hombres, substr(V1,109,116)) Hombres$P65_69 <- with(Hombres, substr(V1,117,124)) Hombres$P70_74 <- with(Hombres, substr(V1,125,132)) Hombres$P75_79 <- with(Hombres, substr(V1,133,140)) Hombres$P80_84 <- with(Hombres, substr(V1,141,148)) Hombres$P85mas <- with(Hombres, substr(V1,149,156))

Manejo de datos

Manejo de datos (Modificar)

Manejo de datos

Manejo de datosRecodificar variable Crea una nueva variable a partir de una ya xistente. Sirve para agrupar datos cuantitativos en intervalos.

Manejo de datosSegmentar variable numérica Simplifica la agrupación de datos cuantitativos en intervalos, aunque por ello es menos flexible que Recode variable.

Manejo de datos

Manejo de datos

Análisis descriptivo

Resumen rápido –> Juego de datos UN del paquete car

Análisis descriptivoResúmenes numéricos Juego de datos Chile de Car

Análisis descriptivo

Análisis descriptivo

Las medidas mediante comandos

Meanmean(Basededatos$NombreVariable)

Mediana: median(Basededatos$NombreVariable)

Media recortada:mean(Basededatos$NombreVariable, trim=0.05)

Amplitud:

diff(range(Basededatos$NombreVariable))

Recorrido intercuartílico:

IQR(Basededatos$NombreVariable)

Coeficiente de variación:

CV<-sd(Basededatos$NombreVariable) / mean (Basededatos$NombreVariable)

Análisis descriptivo

Simetría:

skewness(Basededatos$NombreVariable)

Curtosis:

kurtosis(Basededatos$NombreVariable)

Representaciones gráficas

Representaciones gráficasHistograma

Representaciones gráficas

Representaciones gráficasDiagrama de cajas

Representaciones gráficas

Representaciones gráficas

Insertar el Metafile en un word

Representaciones gráficasGrafico de sectores

Dos variables cualitativas

Leemos el juego de datos cars del paquete datasets

Dos variables cualitativas

Dos variables cualitativas

Dos variables cualitativas

Mas cosas ?

Contrates de Hipótesis, ANOVA

Contrates de Hipótesis, ANOVA

Análisis dimensional

Ajuste de Modelos

Regresión lineal (Ejemplo)

Leemos el juego de datos cars del paquete datasets

Regresión lineal

Regresión linealAjustados el modelo logarítmico

Regresión linealAjustados el modelo logarítmico

Regresión lineal

Regresión lineal

Distribuciones

Distribuciones

Distribuciones

Informes con la librería svViews

Cargamos la librería svViews

view(x, type = "argumento")x=objeto

type= type=“ summary” type=“ print”type=“ twowars”type=“ missing”type=“ sascode”

Informes con la librería svViews

Ejemplos:

view(RegModel.1, type="summary")

Informes con la librería svViews

Ejemplos:

view(cars, type="summary")

Informes con la librería svViewsEjemplos:

view(cars, type="print")view(cars, type="twowars")

Informes con la librería svViews

Ejemplos:

view(cars, type="missing")