ggplot2 Flashcards
ggplot2 est basé sur
ggplot2 est basé sur “grammar of graphics”,
le principe est que vous pouvez construire tous les
graphiques à partir d’un même petit nombre
d’éléments : un jeu de données, un ensemble de
geoms (repères visuels) qui représentent les points
de données et un système de coordonnées.
Pour afficher les valeurs de données, il faut utiliser
les variables du jeu de données en tant que
propriétés esthétiques du geom dans size, color, x
et y.
Les graphs se construisent avec
ggplot() ou qplot()
Présentation
Les suggestions de style +utilisées pour séparer les calques ggplot2 sont très similaires à celles des %>% pipelines.
Espace blanc
+ devrait toujours avoir un espace devant lui, et devrait être suivi d’une nouvelle ligne. Cela est vrai même si votre tracé ne comporte que deux couches. Après la première étape, chaque ligne doit être indentée de deux espaces.
Si vous créez un ggplot à partir d’un pipeline dplyr, il ne devrait y avoir qu’un seul niveau d’indentation.
# Good iris %>% filter(Species == "setosa") %>% ggplot(aes(x = Sepal.Width, y = Sepal.Length)) + geom_point()
# Bad iris %>% filter(Species == "setosa") %>% ggplot(aes(x = Sepal.Width, y = Sepal.Length)) + geom_point()
Bad
iris %>%
filter(Species == “setosa”) %>%
ggplot(aes(x = Sepal.Width, y = Sepal.Length)) + geom_point()
Longues lignes
Si les arguments d’un calque ggplot2 ne tiennent pas tous sur une seule ligne, placez chaque argument sur sa propre ligne et indentez:
# Good ggplot(aes(x = Sepal.Width, y = Sepal.Length, color = Species)) + geom_point() + labs( x = "Sepal width, in cm", y = "Sepal length, in cm", title = "Sepal length vs. width of irises" )
# Bad ggplot(aes(x = Sepal.Width, y = Sepal.Length, color = Species)) + geom_point() + labs(x = "Sepal width, in cm", y = "Sepal length, in cm", title = "Sepal length vs. width of irises")
Longues lignes1
ggplot2 vous permet de manipuler les données, comme le filtrage ou le découpage, au sein de l’ dataargument. Évitez cela et effectuez plutôt la manipulation des données dans un pipeline avant de commencer le traçage.
# Good iris %>% filter(Species == "setosa") %>% ggplot(aes(x = Sepal.Width, y = Sepal.Length)) + geom_point()
# Bad ggplot(filter(iris, Species == "setosa"), aes(x = Sepal.Width, y = Sepal.Length)) + geom_point()