20 sept 2015

Creación de un histograma en R

Llevamos tiempo de no publicar en el sitio. Esperamos retomar estas actividades para divulgar información relacionada con la biología. Hoy traemos una miniguía para la elaboración de un histograma en el software R.

Se tomó el diámetro de 101 lentejas con el fin de determinar en qué intervalos el diámetro es más frecuente. Para ello nos sirve utilizar un diagrama de frecuencias basado en los diámetros de las lentejas. Ahora vamos:

Creamos el vector diámetro ingresando nuestras medidas
d <- c(6.6, 6.28, 6.4, 6.3, 6.2, 6.29, 7, 6.74, 6.7, 6.36, 6.78, 6.36, 6.6, 6.6, 6.6, 6.42, 6, 6.2, 6.38, 5.6, 6.2, 6.36, 6.4, 6.7, 6.58, 6.6, 6.8, 6.6, 7.7, 6.4, 6.88, 7.88, 6.5, 6.3, 7.88, 6.7, 6, 6.5, 6.6, 6.9, 6, 6.48, 6.6, 6.52, 6.8, 6.3, 6.8, 6.1, 6.2, 6.38, 6.5, 6.8, 6.6, 6.54, 5.7, 5.3, 6.28, 6.1, 6.1, 5.1, 5.7, 6.1, 6.4, 6.34, 6.2, 5.1, 6.6, 6.4, 6.7, 6.3, 6.1, 6.1, 6.2, 5.3, 6.4, 5.5, 6.1, 7.4, 5.1, 5.2, 5.3, 5.46, 6.42, 5.94, 5.2, 6.1, 5.7, 6.68, 6.26, 6.34, 6.58, 5, 6.54, 6.78, 6.2, 6.48, 6.4, 6.64, 5.03, 6.88, 6.88)
Para conocer los estadísticos descriptivos básicos (valor mínimo, primer cuantil, mediana, media, tercer cuantil y el valor máximo) de este vector usamos la función summary()
summary(d)
Empleamos la función hist() para realizar el histograma de frecuencias
hist(d)
Obtenemos el siguiente gráfico
Sin embargo, si deseamos modificar elementos de la gráfica podemos hacerlo. Usaremos los siguientes argumentos:
  • col=40, para asignar un color gris a las barras
  • xlab="Diámetro de la lenteja", para poner nombre al eje x
  • ylab="Frecuencia", para poner nombre al eje y
  • main="Distribución de frecuencias del diámetro", para poner el título principal
  • breaks=14, para que los valores se distribuyan en catorce barras
  • prob=T, para poder gráficar la línea de densidad
Uniendo el código tendremos:
hist(d, col=40, xlab="Diametro de la lenteja", ylab="Frecuencia", main="Distribución de frecuencias del diametro", breaks=14, prob=T)
Ponemos la línea de densidad con la función lines() y el argumento density() y obtendremos el siguiente gráfico:
lines(density(d))

 Cualquier duda pueden comentar con gusto atenderé. Saludos

1 comentario: