9.1 La función tibble()

En este apartado veremos cómo crear hojas de datos en R con la función tibble(), del paquete del mismo nombre. El paquete tibble forma parte de tidyverse de forma que no es necesario cargarlo individualmente si ya has cargado tidyverse.

En el siguiente ejemplo se crea una hoja de datos sobre los seis libros más vendidos de la historia y se almacena en un objeto de nombre best_sellers.

best_sellers <- tibble(
  title = c(
    "A Tale of Two Cities",
    "The Little Prince",
    "Harry Potter and the Philosopher's Stone",
    "And Then There Were None",
    "Dream of the Red Chamber",
    "The Hobbit"
  ),
  author = c(
    "Charles Dickens",
    "Antoine de Saint-Exupéry",
    "J. K. Rowling",
    "Agatha Christie",
    "Cao Xueqin",
    "J. R. R. Tolkien"
  ),
  lang = c(
    "English",
    "French",
    "English",
    "English",
    "Chinese",
    "English"
  ),
  year = c(
    1859,
    1943,
    1997,
    1939,
    1791,
    1937
  )
)

Cada argumento de la función tibble() se corresponde con una variable en el formato <nombre variable> = <vector de valores>.

Para ver sólo los títulos de los libros usaríamos

best_sellers$title
[1] "A Tale of Two Cities"                    
[2] "The Little Prince"                       
[3] "Harry Potter and the Philosopher's Stone"
[4] "And Then There Were None"                
[5] "Dream of the Red Chamber"                
[6] "The Hobbit"                              

La función usada tradicionalmente para crear hojas de datos en R es data.frame(). Las hojas de datos creadas con la función tibble() son una versión mejorada de las hojas de datos clásicas creadas con data.frame() y son el estandar actúal. La mayoría de funciones del tidyverse trabajan con este tipo de hojas de datos, que a menudo se refieren como tibbles.