miércoles, 28 de mayo de 2014

Matrices de datos

En la anterior entrada creamos dos objetos diferentes: nombreamigos y edad (click aquí para descargar el script de la anterior entrada). Aunque estos objetos son independientes, están relacionados en el sentido de que a cada uno de los elementos de la nombreamigos (Jesus, Pedro, Pepe, Paco y Luis) les corresponde una edad determinada (35, 36, 33, 27 y 29, respectivamente). Para trabajar mejor con estos datos, lo ideal sería tener combinados estos dos objetos en uno solo que contendría una columna que se llamaría Nombres (con los nombres de nuestros amigos) y otra columna con la variable edad. Es lo que se conoce como matriz de datos. Si queremos combinar estos dos objetos tecleamos lo siguiente: 

Amigos <- data.frame(NombreAmigos, Años)
Con esta instrucción estamos creando un nuevo objeto llamado amigos mediante la función data.frame(). Primeramente, se crea un objeto llamado Amigos (ojo con la mayúscula!) que contiene las variables NombreAmigos y Años en ese mismo orden. Si quisiéramos cambiar el nombre de los objetos que aparecen en la matriz de datos por otros nombres diferentes, lo haríamos con la siguiente instrucción: 

Amigos <- data.frame(Nombre=NombreAmigos, Edad=Años)
Es decir, le estamos pidiendo a R que cree una matriz de datos igual que la anterior, pero con la diferencia de que los objetos NombreAmigos y Años aparecerán en nuestra matriz como Nombre y Edad, respectivamente. Si queremos ver, por ejemplo, el contenido del objeto Nombre de nuestra matriz tecleamos lo siguiente: 

Amigos$Nombre
Lo mismo es aplicable para el objeto Edad: 

Amigos$Edad
En definitiva, para ver el contenido de uno de los objetos de nuestra matriz de datos tenemos que teclear el nombre de la matriz seguida de $ y del nombre del objeto. 

En la siguiente entrada veremos como incluir más variables en nuestra matriz de datos y cómo realizar operaciones sencillas entre las diferentes variables. Nos vemos! 

PD: Si quieres descargar el scrip usado en esta entrada, haz click aquí. Recuerda hacer click en la esquina superior derecha para evitar la publicidad.

miércoles, 21 de mayo de 2014

Creando objetos en R

R, al igual que otros lenguajes de programación, funciona mediante objetos. Los objetos son estructuras sobre las que R puede realizar diferentes tareas. Una variable es un tipo de objeto que utilizamos para guardar datos como, por ejemplo, nombre, edad, número de hijos, etc. Imaginemos que quiero coger a 5 amigos de Facebook e introducir sus datos en R. Lo primero podría ser el nombre. Para ello, tecleamos lo siguiente:

NombreAmigos <- c("Jesus", "Manolo", "Pedro", "Pepe", "Paco")

Una vez que ejecutemos el programa (seleccionando el texto y presionando CTRL + R o haciendo click en run), el objeto NombreAmigos habrá sido creado. Para crear este objeto hemos usado la función concatenar c(), que nos permite agrupar elementos (los diferentes nombres de nuestros Amigos, en este caso) en un solo objeto llamado NombreAmigos. Si escribimos ahora NombreAmigos y ejecutamos la instrucción, aparecerá en la pantalla el contenido de nuestro objeto, en este caso: “Jesus” “Manolo” “Pedro” “Pepe” “Paco”. Por el contrario si escribimos nombreamigos (en minúscula), obtendremos un error, ya que R es sensible a las mayúsculas y minúsculas.

Imaginemos ahora que Manolo se quita de Facebook y que Luis, otro amigo, se hace una cuenta. Si queremos quitar a Manolo de nuestro objeto NombreAmigos, tecleamos lo siguiente:

NombreAmigos<- NombreAmigos[NombreAmigos != "Manolo"]

Con esta instrucción lo que estamos haciendo es reescribir el objeto NombreAmigos usando el objeto NombreAmigos creado en primera estancia, pero eliminando (!=) a Manolo, o dicho de otro modo, devolviéndonos aquellso componentes que no sean igual (!=) a Manolo. Si escribimos NombreAmigos, veremos que Manolo ha desaparecido de la lista. Si queremos añadir a nuestro nuevo contacto Luis, tecleamos lo siguiente:

NombreAmigos <- c(NombreAmigos, "Luis")

Con esta instrucción, le estamos pidiendo a R que reescriba el objeto NombreAmigos, concatenando el anterior NombreAmigos (a la que ya se había eliminado a Manolo) y añadiéndole Luis. Si escribimos NombreAmigos y presionamos enter, nos aparecerá lo siguiente: "Jesus" "Pedro" "Pepe"  "Paco"  "Luis".

Vamos a crear ahora otro objeto que contenga la edad de cada uno de nuestros amigos de Facebook. Imaginemos que la edad de nuestros amigos Jesús, Pedro, Pepe, Paco y Luis es 35, 36, 33, 27 y 29, respectivamente. Para crear este nuevo objeto, tenemos que ejecutar la siguiente instrucción.

Años <- c(35, 36, 33, 27, 29)

El script con todas las instrucciones que se han visto en esta entrada, puedes descargarlo aqui. Para abrirlo solo tendrás que presionar File->open file y sólo tendrás que buscar el archivo en tu ordenador.

Hasta pronto!

miércoles, 14 de mayo de 2014

Un vistazo rápido a Rstudio

La primera vez que ejecutamos Rstudio veremos algo así:


Aunque reconozco que no se ve excesivamente bien, creo que es suficiente para hacernos una idea de la estructura. Lo más importante de todo es la consola, que es la ventana situada a la izquierda. En dicha ventana, introduciremos el código de programación. Más adelante veremos para que sirven el resto de ventanas, pero nos daremos cuenta que son bastantes intuitivas. 

Vamos a realizar un pequeño ejercicio. Escribamos en la consola el siguiente código:

print("Hola Mundo!")
Si pulsamos la tecla "enter", veremos que R nos devuelve la frase "hola mundo!". Enhorabuena, has ejecutado tu primer programa en R. Básicamente, le hemos dicho a R que, mediante la función print(), escriba la frase "hola mundo!" Para usar esta función, es importante que la frase que queramos que aparezca esté entrecomilladas). Un poco más adelante explicaremos qué es una función. 

Aunque podemos realizar cualquier tipo de programa mediante la consola, la tarea de programación se facilita si usamos lo que se conocen como scripts. Dicho de forma sencilla, los scripts son archivos de texto en los que podemos escribir líneas de código para poder ejecutarlas posteriormente. Una ventaja de este tipo de archivos es que nos permite o bien ejectuar bloques de instrucciones o bien ejecutarlos individualmente. Vamos a verlo mediante un ejemplo. Primeramente abriremos un script (file-> New file ->R Script). Una vez abierto el script, tecleamos lo siguiente:

print("Hola Mundo!")
print("Adiós Mundo!")

Para ejecutar estas dos instrucciones tenemos dos opciones. Podemos ejecutar cada instrucción de manera separada,  para lo que colocamos el cursor del ratón en la instrucción  que queramos ejecutar y pulsamos Ctrl + r (o en la parte superior izquierda de nuestro script hacemos click en "run"). Por otro lado, podemos ejecutar las dos instrucciones a la vez seleccionando con el ratón el texto que queremos ejecutar y presionando Ctrl + r (o en la parte superior izquierda de nuestro script hacemos click en "run").

Otra de las ventajas obvias de usar scripts es que se pueden guardar fácilmente como archivos de texto, pudiéndolos cargar cuando queramos. Para ello tecleamos Ctrl + s, y especificamos la carpeta destino en la que guardaremos el script.

Hasta la próxima!


martes, 13 de mayo de 2014

Instalando R

Si aún no tienes R instalado en tu ordenador, ha llegado la hora de hacerlo.  Podemos instalar el propio programa R haciendo click aquí y seleccionando la versión que necesitemos según las características de nuestro equipo. Con esto obtendríamos la versión más básica de R, el propio lenguaje de programación, y ya con esto podríamos empezar a realizar diferentes operaciones con R.

Sin embargo, mi recomendación es instalar Rstudio. Este software, que lógicamente es totalmente compatible con R, es lo que se denomina una IDE (del inglés, Integrated Development Environment). Dicho de manera sencilla, una IDE es un entorno que nos facilita un poco el trabajo con R,  ofreciéndonos características como autocompletar texto, cambiar el color de la fuente, etc. Para instalar Rstudio es necesario que primero instalemos R. Una vez realizada la instalación, basta con hacer click aquí y seleccionar la versión que precisemos según las características de nuestro equipo. 

En la siguiente entrada ya empezaremos a trabajar con R. Nos vemos

¿Qué es R?

Antes que nada quiero darte la bienvenida a este blog, que trata sobre el análisis estadístico usando R. Si has llegado aquí de manera casual igual te estás preguntando qué es R: Dicho de una manera rápida R es un software que nos permite analizar y representar gráficamente nuestros datos. Bajo mi opinión, las dos características más importantes de R son:

1. Es totalmente gratuito. Un programa con la potencia para el análisis de datos que tiene R puede llegar a costar en el mercado varios miles de euros. R lo podemos descargar e instalar gratuitamente en nuestro ordenador simplemente haciendo click aquí (Click en la esquina superior derecha para saltar la publicidad).

2. Es muy versátil. A diferencia de otros programas estadísticos, R nos permite hacer cualquier tipo de análisis. Una vez que hemos instalado R, ya podemos realizar análisis de datos más o menos complejos. Como veremos,  R funciona mediante funciones. Una función es simplemente una instrucción de lo que queremos hacer. Por ejemplo, si queremos calcular la media de varios valores, usaremos la función mean() . En el caso que necesitemos una función concreta que no está incluida en el programa, podremos descargar lo que se llaman “paquetes” que sí la contengan. Y si no existe tal paquete, podremos crear nosotros mismo la función.  Esto hace que en R podamos realizar cualquier tipo de operación sobre nuestros datos.

Uno de los problemas de R es que no es muy atractivo visualmente. A diferencia de otros softwares de análisis estadísticos en los que para realizar una determinada función solo tenemos que clickear en diferentes ventanas o cuadro de diálogos, en R tendremos que escribir en código de programación. Aprender este código puede convertirse en una tarea bastante frustrante. La idea de este blog es hacer este camino un poco más fácil. Cada semana intentare publicar una nueva entrada en la que explicare como realizar diferentes análisis usando R, así como algunas notas sobre estadística. Espero que este blog te sea muy útil.

Nos vemos en la siguiente entrada!