• Réduire le texte

    Réduire le texte
  • Rétablir taille du texte

    Rétablir taille du texte
  • Augmenter le texte

    Augmenter le texte
  • Imprimer

    Imprimer

Groupe State of the R, les dernières innovations du logiciel d'analyse de données R pour centre d'intérêt

Le groupe State of the R réunit chercheurs et ingénieurs utilisateurs quotidiens de la méthode statistique R dans la perspective de partager et d’approfondir les savoir-faire, d’échanger autour des dernières innovations et d’en favoriser la diffusion.

Graphe statistique. © Sean Gladwell Fotolia, Sean Gladwell
Mis à jour le 13/02/2018
Publié le 12/02/2018
Mots-clés : statistique

Chercheurs et ingénieurs de l’UMR Mathématique et informatique appliquées (Inra, AgroParisTech) de l’Inra Île-de-France - Versailles-Grignon concourent à développer de nouvelles méthodes statistiques pour l'analyse des données omiques, qu’ils expérimentent sous forme de code informatique (C++, Python, Julia, R). Afin de promouvoir la reproductibilité scientifique de ces méthodes et d’en assurer la diffusion, l’utilisation de bibliothèques (en anglais, packages) est devenue un standard très populaire.

 

Du logiciel R…

Au cœur de la communauté des statisticiens, le logiciel R s’est imposé comme un standard pour l’analyse des données omiques. Il s’appuie sur une communauté de développeurs et d’utilisateurs extrêmement dynamiques qui proposent les avancées les plus récentes de la statistique et de disciplines connexes (machine learning, optimisation, analyse numérique).

Ces innovations et l’évolution permanente de R nécessitent une veille constante. Le statisticien se devra notamment de suivre les derniers développements offerts par la communauté (par exemple, via l’utilisation de techniques d’optimisation spécifiques ou l’interfaçage avec les plateformes de deep-learning TensorFlow et H20) afin de concevoir à son tour des méthodes adaptées aux données actuelles. Elles demandent une connaissance approfondie du logiciel. Elles doivent également pouvoir s’appuyer sur des compétences en techniques de programmation afin de produire des codes efficaces et portables et de mettre en œuvre la programmation parallèle, l’interfaçage de R et des langages compilés (C++) et l'utilisation d’objets R modernes (gestion de gros jeux de données par exemple).

L’avènement de l’interface RStudio, un environnement de développement intégré pour la programmation avec R, a élargi considérablement le spectre d’utilisation de celui-ci. RStudio permet d’intégrer l’écriture de documents scientifiques, l’analyse de données et la publication de ces documents. Ainsi, une page web, un article de journal, un support de cours interactif ou une présentation scientifique peuvent être produits à partir d’une même source, à l’aide des langages Rmarkdown, Shiny, LaTeX, knitr et autres.

La maîtrise de ces outils est indispensable pour s’adapter et participer activement au changement de paradigme de la diffusion de la connaissance et du savoir scientifique. 

 

… au groupe State of the R

Au cours de l’été 2017, le groupe State of the R a vu le jour pour répondre aux questions d’aide à la diffusion des méthodes ou la veille sur l’univers de R.

L’objectif majeur de State of The R est de définir un espace qui permette d’adopter un vocabulaire commun, des pratiques de programmation performantes et des modes de représentation standardisées pour une meilleure généricité des outils statistiques utilisés par la communauté des mathématiciens et informaticiens du département scientifique Inra mathématiques et informatique appliquées – Rappelons que ce collectif scientifique regroupe de nombreux réseaux méthodologiques (NetBio - inférence de réseaux biologiques; Mires - analyse de réseaux en sociologie; STrATEGe - inférence de réseaux en écologie; AIGM - algorithmique et modèles  graphiques; RESSTE - données spatio-temporelles).

A ce jour, d’ores et déjà fort de six mois d’existence, le groupe State of the R a créé des espaces de travail commun (https://github.com/stateofther), dressé un bilan de ses activités (https://stateofther.github.io/post/roscoff2017/) et animé quatre ateliers mensuels depuis septembre 2017.

Enfin, il anime une page web du groupe (https://stateofther.github.io/)  et communique via une liste de diffusion (stateofther@agroparistech.fr).

A court terme, State of the R gagnera à évoluer vers un groupe méthodologique et à pérenniser ateliers et sessions de formation en les ouvrant à des invités extérieurs, contribuant par là même à positionner l’Inra à la pointe du développement en R.

Contact(s)
Contact(s) scientifique(s) :

Département(s) associé(s) :
Mathématiques et informatique appliquées
Centre(s) associé(s) :
Versailles-Grignon