Vamos a
imaginar que un investigador está interesado en estudiar la relación entre el
nivel de ansiedad y la puntuación en una prueba de memoria. Para ello evaluó la
ansiedad en 20 participantes a los que posteriormente sometió a una prueba de
memoria visual. Para tener los datos, descárgalos en tu ordenador y agrégalos a
tu directorio de trabajo (click para descargar la matriz). Como ya vimos antes para crear un directorio de
trabajo, usamos la función setwd(). Entre paréntesis incluiremos la
ruta. En mi caso sería:
setwd("D:/R")
Como ya
dijimos, para hacer gráficos usaremos el paquete ggplot2. Si no lo hemos
descargado, lo hacemos con la siguiente instrucción:
install.packages("ggplot2")
Después de instalar el paquete, hay que
referenciarlo o lo que es lo mismo, decirle a R que lo vamos a usar. Esto lo
hacemos con la siguiente instrucción:
library(ggplot2)
Lo siguiente seria cargar la matriz de datos “ansiedad.csv”. Para ello ejecutamos la siguiente instrucción:
datos_ansiedad <- read.csv("ansiedad.csv", header=T)
El
objeto ansiedad es una matriz de datos formada por las siguientes variables:
- Género: sexo del participante
- Ansiedad: puntuación en la escala de ansiedad antes de realizar la prueba de memoria visual
- Puntuación: puntuación en la prueba de memoria visual
dispersion <- ggplot(datos_ansiedad, aes (Ansiedad, Puntuacion))
Con
esta instrucción hemos creado un objeto llamado dispersión basado en la matriz
datos_ansiedad y hemos especificado que queremos que la variable Ansiedad
aparezca en el eje x y puntación en el eje y. Sin embargo, no le hemos dicho
como queremos representar esta información (de hecho, si ejecutamos dispersion
no aparecerá nada). En nuestro caso queremos que la información sea
representada mediante puntos, así que tendremos que ejecutar el siguiente
comando:
dispersion + geom_point()
Si le echamos un vistazo rápido al gráfico, observamos que parece existir una relación negativa entre el nivel de ansiedad y la puntuación en la prueba de memoria visual: a mayor ansiedad menor nota. Los diagramas de dispersión suelen tener una línea que resume la tendencia de los datos (línea de regresión). Si queremos añadir esta línea, podemos hacerlo con la función geom_smooth():
dispersion + geom_point()+geom_smoth()
Con esta línea podemos ver más claramente que a mayor nivel de ansiedad, peor suele ser la nota en el examen de memoria visual. El área sombreada alrededor de la línea, representa el intervalo de confianza al 95% de la misma. Si queremos que la línea sea recta en vez de curva tendremos que añadir el método lm (linear model) en nuestra función geom_smooth():
dispersion + geom_point()+geom_smooth(method ="lm")
0 comentarios :
Publicar un comentario