forked from MTES-MCT/parcours_r_socle_introduction
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy path02-generalite.Rmd
127 lines (82 loc) · 6.07 KB
/
02-generalite.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
# R, son écosystème et ses possibilités
```{r gen_1, echo=FALSE, results='hide', message=FALSE, warning=FALSE}
require (tidyverse)
require (sf)
require (cartography)
mapReg <- st_read ("data/REG.shp")
```
## Le groupe de référents
- Un groupe pour structurer une offre de formations sur R
- Un réseau d'entraide
```{r mapg2r, echo=FALSE, message=FALSE}
reg <- c("11","24","32","44","93","76","52")
ref <- c("R.Morel, B.Vermont \n F.Brouillet, M. Zellou",
" Jérôme Baret \n Olivier Chantrel \n F. Dos Santos- \n Pereira \n M. Lethrosne",
"",
"T. Zorn",
"B. Terseur \n M. Rajerison",
"A. Dumont",
"J. Engelaere- \n Lefebvre \n M. Theulière")
df <- data.frame (reg=reg, ref=ref)
map <- merge (mapReg, df, df, by.y="reg", by.x="Num_reg", all.x=T)
par (mar=c(.2,.2,.2,.2))
plot (st_geometry (map), col="lightgrey", border="white")
labelLayer (map, txt = "ref")
```
## R c'est quoi ?
- Un langage de programmation interprété exécutable pas à pas $\rightarrow$ lignes de code
- Un logiciel interactif permettant de traiter divers types de données
## Un peu d'histoire
- À l'origine existait le langage S, servant à programmer avec des données (*Bell laboratory*, années 70)
- Au milieu des années 90, mélange de S et du langage Lisp pour le dédier à l'analyse de données et aux graphiques $\rightarrow$ création de R. [Ihaka R, Gentleman R (1996) R: A Language for Data Analysis and Graphics. *Journal of
Computational and Graphical Statistics*, 5(3), 299–314](https://www.stat.auckland.ac.nz/~ihaka/downloads/R-paper.pdf)
- S'est d'abord développé dans le monde académique, puis a essaimé vers d'autres domaines professionnels, voire associatifs
- Système toujours d’actualité - Mise à jour tous les 6 mois
- Avenir dans la statistique publique : adopté comme standard par l'Insee (à l'horizon 2025) et divers SSM. Des packages pour :
- charger les données produites par l'Insee au format sdmx,
- charger les formats des organisations internationales (Eurostat, OCDE, ONU, etc.),
- gérer les millésimes du référentiel communal, etc.
## Un logiciel libre
- Disponible en libre téléchargement sur [le site officiel du CRAN](https://cran.r-project.org)
- Installable sur la plupart des systèmes d'exploitation
- Utilisé en recherche, en enseignement et en entreprise
- Une communauté très active :
- Forum des [utilisateurs de R en français](http://forums.cirad.fr/logiciel-R/)
- Communauté française des utilisateurs de R (avec des packages spécifiques, qui permettent de gérer les changements de géographie communale par exemple) : [Frrrenchies](https://github.com/frrrenchies/frrrenchies)
- Slack de ces utilisateurs (pour les questions/réponses, actualités...) [Slack](https://r-grrr.slack.com/)
- Forum des utilisateurs de R en français : http://forums.cirad.fr/logiciel-R/
- R-bloggers : https://www.r-bloggers.com/
- Stackoverflow : https://stackoverflow.com/questions/tagged/r
C'est un logiciel libre : les utilisateurs ont la liberté d'exécuter, copier, distribuer, étudier, modifier et améliorer ce logiciel. R fait partie de la "galaxie" GNU (GNU's Not Unix). R est donc libre, gratuit et multiplateforme.
[Le site CRAN = Comprehensive R Archive Network](https://cran.r-project.org) est le site de référence pour R. Il contient non seulement les installeurs du logiciel mais également de nombreuses ressources : documentations, FAQ, tutoriels...
## Que peut-on faire avec R ?
- Lire des données de formats divers
- Les manipuler (prétraitements)
- Les enrichir à partir de données externes
- Les analyser, les modéliser
- Présenter les résultats (tableaux, graphiques, cartes)
- Publier ...
... et ce au moyen d'une palette de méthodes extrêmement diversifiée.
Privilégie la flexibilité et le découpage des traitements en parties simples.
![](images/illustrations.png)
## Un logiciel modulaire
- Le package `base` contient nombreuses fonctionnalités
- Extensible au moyen de **packages** (1 package = 1 ensemble de nouvelles fonctions)
- Nombreuses extensions spécialisées
- Proposition d'une version installable de R + ensemble de packages utiles
De base, R permet déjà de faire un très grand nombre de choses avec son socle commun : le package `base`. Pour afficher la liste des fonctions disponibles dans le package `base` :
```{r gen_2, eval = F}
library(help = 'base')
```
Sur ce package `base` vient se greffer un ensemble de packages (plugins, modules) complémentaires.
Un package est une bibliothèque de fonctions. La plupart de ceux qui font référence sont mis à disposition de tous sur le dépôt CRAN.
Cela permet d'étendre à l'infini les possibilités de R : celles-ci sont seulement limitées par la volonté de développement des utilisateurs.
De même que les packages sont dépendants de fonctions du module principal `base`, certains packages peuvent être dépendants de fonctionnalités d'autres packages $\rightarrow$ notion d'arbre des dépendances (géré par R de façon transparente).
Sructure modulaire $\rightarrow$ il existe de multiple façons d'effectuer une même tâche. Il suffit d'une méthode maîtrisée pour aller au résultat.
Les fonctionnalités utilisables dans R, sont en perpétuelle évolution et permettent d'intégrer les méthodes les plus récentes dans des domaines qui évoluent rapidement : modélisation, analyse spatiale, dataviz,...
Le groupe des référents propose un pack d'installation comprenant R, RStudio et un ensemble de packages en phase avec le parcours de formation. Vous pouvez le [télécharger ici](http://pne.metier.e2.rie.gouv.fr/suite-logicielle-r-r974.html) en deux fichiers compressés (nécessite un accès intranet MTES-MCT).
## Des exemples de ce qu'on peut faire avec R :
- Le support de cette formation
- [Visualisation du compte du logement](http://dataviz.statistiques.developpement-durable.gouv.fr/csl2017/)
- [Les pesticides dans les cours d'eau des Pays de la Loire](https://ssm-ecologie.shinyapps.io/qualite-des-eaux/)
- [Des exemples de ce qu'on peut faire avec shiny](http://shiny.rstudio.com/)