miércoles, 18 de junio de 2014

Diseños intrasujetos y mixtos

Vamos a imaginar otro experimento con un diseño un poco diferente. Imaginemos que queremos conocer la importancia de ciertas áreas cerebrales en la memoria espacial. Para ello tenemos cuatro grupos de ratas a las que se les ha diseccionado una parte diferente del cerebro a cada grupo (Grupo1, Grupo2, Grupo3 y Grupo4). Además tenemos un quinto grupo a la que no se le realizo ninguna disección (Grupo5). El experimento consistía en tres diferentes fases. Se cronometra el tiempo (en segudos) que una rata tarda en recorrer un laberinto (Tiempo_1). Las ratas del grupo 1, 2, 3 y 4 fueron sometidas cirugía de disección, mientras que a las del grupo 5 se les sometió  a una pequeña cirugía, pero sin disección. Se volvía a cronometrar el tiempo que las ratas tardaban en cruzar el laberinto (Tiempo_2). En la siguiente tabla se puede ver la matriz de datos:


El diseño de este experimento es un poco diferente al anterior. Tenemos la variable intersujetos grupo, la cual toma cinco valores diferentes (los diferentes grupos). Por otro lado, tenemos la variable tiempo que es una variable intrasujetos (todos los sujetos pasan por las diferentes condiciones de esta variable) con dos niveles: Tiempo_1 y Tiempo_2. Este tipo de diseño recibe el nombre de diseño mixto. Vamos a introducir los datos en R.

Tenemos la variable cualitativa nominal Grupo. Como hemos visto anteriormente, introducirla en R es sencillo, pero tenemos que tener en cuenta que hay 4 ratas en cada grupo, por lo que la mejor opción es usar la función rep(): 

Grupo <- c(rep(1,4), rep(2,4), rep(3,4), rep(4,4), rep(5,4))
Una vez que hemos introducido la variable Grupo, tenemos que factorizarla. Como ya vimos anteriormente, la instrucción es la siguiente

Grupo <- factor(Grupo, levels = c(1,2,3,4,5), labels = c("Grupo1", "Grupo2", "Grupo3", "Grupo4", "Grupo5"))
Como en el caso anterior mediante la instrucción c(1,2,3,4,5) le hemos dicho a R los niveles o valores que tiene nuestra variable grupo. Un pequeño truco para simplificar es usar la siguiente instrucción c(1:5) que literalmente significa todos los valores entre 1 y 5. De esta forma, la anterior instrucción quedaría simplificada como sigue:

Grupo <- factor(Grupo, levels = c(1:5), labels = c("Grupo1", "Grupo2", "Grupo3", "Grupo4", "Grupo5"))
Ya hemos introducido la variable grupo. La siguiente variable es la variable Tiempo. Esta variable es numérica y tiene dos niveles: Tiempo_1 y Tiempo_2. Sin embargo, a diferencia de la variable Grupo, estamos ante una variable intrasujeto, ya que todos los participantes pasan por todas las condiciones de esta variable. Esto anterior lo tenemos que tener en cuenta en R: si miras la tabla anterior, en una variable intersujeto los diferentes niveles son colocados según las filas de la tabla, sin embargo, los diferentes niveles de una variable intrasujetos son colocados en diferentes columnas. De esta manera, nos aseguramos que todos los sujetos pasan por cada una de las condiciones de esta variable. Para realizar esto anterior en R, tendríamos que crear dos diferentes objetos en R: una con cada condición de la variable Tiempo. Así para Tiempo_1 seria:

Tiempo_1 <- c(20,22,19,22,25,20,23,22,19,25,22,24,22,23,21,20,24,22,23,18)
Y para tiempo tiempo_2:

Tiempo_2 <-c(18,18,20,19,22,13,12,15,17,16,19,20,17,12,19,13,14,12,11,9)
Una vez hecho esto, pasamos a crear nuestra matriz de datos

Datos <- data.frame(Grupo, Tiempo_1, Tiempo_2)
Un pequeño apunte: en este caso, y a diferencia de lo que vimos en la entrada anterior, hemos factorizado la variable grupo antes de introducirla en la matriz de datos. Esto es todo por hoy. 

PD: Si quieres descargar el script que hemos usado, haz click aquí 


2 comentarios :

Pepe Trujillo dijo...

Aunque evidentemente son variables, yo creo que es más claro hablar de factores cuando hablamos de variables cualitativas como es el caso del Grupo y el Tiempo. También son variables tanto la respuesta como las covariables; si precisamos creo que las cosas se aclaran un poco.

Por otra parte, en mi opinión, la matriz de datos, considerando la variable respuesta como una única variable con dos condiciones experimentales, debería ser:

Grupo <- factor(rep(1:5, each=4, times=2),labels=c("Grupo1", "Grupo2", "Grupo3", "Grupo4","Grupo5"))
Tiempo <- c(20,22,19,22,25,20,23,22,19,25,22,24,22,23,21,20,24,22,23,18,18,18,20,19,22,13,12,15,17,16,19,20,17,12,19,13,14,12,11,9)
Rata <- factor(rep(1:20, times=2),labels=paste("Rata", 1:20, sep=""))
Datos<-data.frame(Grupo,Tiempo,Rata)

Esta estructura está conforme con la previsible fórmula del modelo esbozado:

Tiempo ~ Grupo | Rata

A.J. Estudillo dijo...

Gracias por tu comentario, Pepe. Con respecto a la matriz lo puse en formato ancho porque asumo que la mayoría de los lectores estarán acostumbrados a usar ese formato en SPSS. Cuando empiece con los gráficos con ggplo2, tendré que usar el formato largo y haré una entrada sobre ello. Gracias de nuevo!

Publicar un comentario