Guía de Ejercicios

Manipulación y Visualización de Datos

Profesor: Mauricio Vargas Sepúlveda
Ayudantes: Maximiliano Diener, Teresa Valdivia, José Vinés

2017-10-03

[Borren las partes que tienen [] al completar sus desarrollos, en adelante [] contendrá una instrucción o explicación]

[Creen un proyecto compartido en RStudio Server y guarden este documento editable en el directorio del proyecto]

[Editen el encabezado del presente documento, incluyan sus nombres y generen un documento HTML a partir de este archivo]

[Agreguen títulos siempre que sea necesario]

Pregunta 1

Carguen las librerías dplyr, ggplot2, forcats y readr.

# [insertar codigo]

Pregunta 2

Muestren las primeras observaciones del dataset mpg.

# [insertar codigo]

Pregunta 3

Conviertan el siguiente código en ejecutable:

ggplot(data = mpg) +
  geom_point(mapping = aes(x = displ, y = hwy))

Pregunta 4

Seleccionen uno (y sólo uno de los siguientes gráficos), expliquen la relación entre displ y hwy y por qué el gráfico elegido es más indicado que los otros:

ggplot(mpg) + geom_point(aes(x = displ, y = hwy, color = class))
ggplot(mpg) + geom_point(aes(x = displ, y = hwy, size = class))
ggplot(mpg) + geom_point(aes(x = displ, y = hwy, shape = class))
ggplot(mpg) + geom_point(aes(x = displ, y = hwy, alpha = class))

Pregunta 5

Conviertan el siguiente gráfico en un boxplot:

ggplot(mpg) + geom_point(aes(class, hwy))

Pregunta 6

Construyan un histograma de la variable hwy

Pista: Hay que definir solo la variable del eje “x”

# [insertar codigo]

Pregunta 7

Construyan un gráfico de densidad de la variable hwy coloreado de acuerdo a la variable class

# [insertar codigo]

Pregunta 8

Construyan un gráfico de barras de la variable hwy coloreado de acuerdo a la variable class

# [insertar codigo]

Pregunta 9

Expliquen qué hace cada línea del siguiente código y luego expliquen el gráfico resultante:

ggplot(mpg) +
   geom_point(aes(displ, hwy)) +
   geom_smooth(aes(displ, hwy))

Pregunta 10

Agreguen una (y sólo una) línea al siguiente código para ver las primeras observaciones del dataset babynames

# install.packages("babynames")
library(babynames)

Pregunta 11

En el dataset babynames filtren los que correspondan al nombre Khaleesi. Luego usen la función summarise() para encontrar:

  1. El total de bebés que se llaman Khaleesi
  2. El primer año que Khaleesi aparece
# [insertar codigo]

Pregunta 12

Creen un gráfico de barras descendente con los 10 nombres que más se repiten y otro con la cantidad de niños nacidos por año.

# [insertar codigo]