Guillaume Pressiat
SIMAP / DOMU / AP-HP
16 janvier 2017
Comment accéder aux données du Programme de Médicalisation des Systèmes d'Informations (PMSI) directement avec R ? Les données sont souvent traitées dans des logiciels propre au PMSI ou des outils statistiques / BDD du marché. Ces outils ne permettent pas de réaliser des traitements statistiques ou de l'infographie, les départements d'information médicale sont amenés à retraiter ces données dans R.
Quelles que soient les qualités reconnues de R (libre, évolutif), ces possibilités (visualisations, modèles statistiques, cartographies, ...), l'une des plus importantes de ses évolutions récentes est la possibilité de manipuler des bases de données de taille importante.
Le package pmeasyr s'inscrit dans cette veine : réaliser de façon autonome l'ensemble des traitements dans R.
Cette direction que prend R permet un flux de travail unique, travailler le plus possible dans un seul logiciel : si tout le travail est réalisé dans un seul projet, dans un seul programme, sur un seul logiciel, la traçabilité, la reproductibilité et la mise à jour d'une étude est facilitée.
Habituellement, le travail avec de multiples logiciels oblige à l'export/import de fichiers entre les différents logiciels, et chaque modification du début du flux de travail génère des fichiers exportés v1, v2, ...
Avec un flux complet dans R, aucun export / import de fichiers n'est nécessaire. De ce fait, toute nouvelle modification est intégrée au processus de travail global. La localisation de toutes les étapes d'une analyse en un seul point évite les erreurs et la confusion lorsque l'on reprend l'étude ultérieurement.
L'engouement autour de R est lié au développement de packages intuitifs et performants : readr, dplyr, tidyr, magrittr, pour n'en citer que quelques uns. pmeasyr s'appuie sur ces packages pour proposer des imports de données rapides sur des fichiers de taille importante (l'entité juridique de l'AP-HP est prise en charge sans problème avec un ordinateur récent).
Dans le cas de pmeasyr, l'import de 100 000 rsa (partie fixe, parsing des passages unités médicales, des diagnostics associés et des actes) nécessite en moyenne 5 secondes avec un processeur i7 16Go de ram.
Le package contient des fonctions pour la gestion des archives PMSI en entrée / sortie des logiciels de l'ATIH (in / out) : (dézippage / suppression des archives) et des fonctions pour l'import des fichiers des champs PMSI MCO, SSR, HAD, PSY et RSF.
Il est utilisé depuis un an à l'AP-HP pour des analyses d'activité et la description des prises en charge.
devtools::install_github('IM-APHP/pmeasyr')
Avec cette commande les dépendances du package et le package sont installés.
Une fois le package correctement installé, accéder à la vignette introductive du package :
browseVignettes('pmeasyr')
Ou bien consulter la vignette en ligne.