Les ateliers ont doréanavant lieu sur le campus AgroParisTech de Palaiseau, 22 place de l’Agronomie.
Lors de cet atelier, Pierre Barbillon et Emré Anakok nous ont présenté les réseaux de neurones graphiques puis leur implémentation avec pytorch geometric. Aide à l’installation Pour l’installation de Python et la création d’environnement pour ceux qui n’ont pas l’habitude de Python
Lors de cet atelier, Lucia Clarotto nous a partagé son retour d’expériences sur l’utilisation de quarto pour créer son site personnel. Les documents disponibles sur le site de Samantha Csik ont été particulièrement utiles.
Lors de cet atelier, Christophe Regouby nous a présenté le package R {torch} ainsi que d’autres packages associés. Résumé : Il s’agit d’un atelier d’exploration des possibilités de {torch} et de son écosystème mlverse de packages.
Lors de cet atelier, Cédric Midoux et Mahendra Mariadassou nous ont présenté quarto. Résumé : Quarto est un système de publication scientifique et technique open-source, basé sur Pandoc. Il permet de :
Antoine Bichat et Julie Aubert ont rejoué le tutoriel donné aux rencontres R 2024 pour apprendre à créer un"pipeline" complet pour l’apprentissage automatique avec {tidymodels}. Résumé : {Tidymodels} regroupe un ensemble de packages facilitant l’utilisation de méthodes d’apprentissage statistique (telles que les forêts aléatoires, modèles linéaires bayésien ou non…) dans un cadre unifié et “tidy”.
Jérémy Lamouroux et Florian Teste nous ont préparé un atelier autour du package R {terra} le nouveau package remplaçant {raster} pour faire de l’analyse spatiale en plus rapide, plus facilement avec plus de possibilités.
Présentation de {pyPLNmodels} Bastien Batardière nous présente le package python {pyPLNmodels}, conçu spécifiquement pour l’analyse de données de comptage. Ce package repose sur les modèles PLN et PLN-PCA (Chiquet, Mariadassou, and Robin 2018, 2021), qui font l’hypothèse d’une couche latente gaussienne.
Hugo Gangloff nous a concocté une séance sur l’utilisation des auto-encodeurs variationnels pour le traitement de données single-cell RNA-Seq en Python avec PyTorch. Résumé : Cet atelier Happy R est divisé en trois parties dédiées aux autoencodeurs variationnels (VAE) (Kingma and Welling 2014) pour le traitement de données scRNA-seq.
Prerequisites R packages : torch, ggplot2, coro, tidyverse Content Automated Differentiation Slides. TP. Mini-bach Gradient Descent Slides. TP. Variational AutoEncoder Slides. TP. Data Training data in .rds Test data in .
Dans cette séance, Annaig de Walsche, Mary Savino et Marina Gomtsyan nous ont proposé une découverte de l’utilisation de Git via RStudio pour profiter des nombreux intérêts qu’il offre, notamment la gestion d’un travail collaboratif.
Au programme de ce premier atelier de la saison 2022-2023 une présentation du réseau et un retour sur le camp d’été 2022 à la station biologique de Paimpont : Présentation du réseau et des sujets abordés lors du bootcamp 2022 Comment fouiller dans les bases de données de R et sur github pour lister les packages développés par le labo ?
Pour ce premier atelier sur notre nouveau campus de Palaiseau, Nicolas Jouvin (UMR MIA-Paris-Saclay) nous a présenté son package {greed}, développé avec E. Côme (IFSTTAR). {greed} Clustering and Model Selection with the Integrated Classification Likelihood
Cédric Midoux nous a présenté une démonstration de construction d’une application shiny avec le package golem. Lien vers le dépôt d’une application exemple.
Le 14 janvier nous nous sommes retrouvés pour une séance premiers pas pour débuter avec le package {shiny} permettant le développement d’application web interactive avec R. L’objectif étant de s’autoformer à partir de supports existants et d’échanges pour nous permettre de suivre sereinement la séance de février (par C.
Sophie Donnet and Julie Aubert propose us an introductory workshop on variational autoencoders using the keras R package under RStudio. The slides are downloadable here and the tutorial here for the complete html version and here for the only R command.
Eric Adjakossa et Tâm Le Minh ont animé un atelier pratique de découverte de git : Apprendre à utiliser Git pour profiter des nombreux avantages qu’il offre, y compris l’organisation efficace d’un travail collaboratif.
Charles Ollion et Sylvain Le Corff (CMAP) nous ont proposé une session pratique autour de l’apprentissage profond bayésien. Summary Deep learning is widely used for regression and classification problems, but the simplest architectures do not capture model uncertainty.
Ghislain Durif a animé un premier atelier pratique autour des problèmes de l’optimisation et de leur résolution (résumé ci-dessous) le 12 février 2020. Les instructions pour installer les différents packages pour les tutoriels sont disponibles ici.
Ghislain Durif a animé un premier atelier pratique autour des problèmes de l’optimisation et de leur résolution (résumé ci-dessous) le 22 janvier. Les instructions pour installer les différents packages pour les tutoriels sont disponibles [ici] (https://github.
Source principale : (https://rmarkdown.rstudio.com/authoring_bibliographies_and_citations.html) Lister ses références A l’aide d’un fichier de bibliographie Pandoc peut générer automatiquement des citations et une bibliographie dans différents styles. Il suffit de préciser le nom du fichier de bibligraphie en utilisant le champs bibliography dans le YAML des métadonnées du document .
Confinement oblige, ce vendredi 17 avril 2020 a lieu le premier State of the R en distanciel. Antoine nous a proposé une séance de live coding consacrée à la création de package sous Twitch, une plateforme de diffusion de vidéos en flux continu, qui permet de partager en temps réel l’écran et la petite bouille d’Antoine.
Mahendra nous offre un tour sur la plateforme Migale et plus généralement sur la soumission de job sur un serveur de calcul via qsub et les packages purrr, future and furrr.
Antoine nous parlera de la manipulation des objets un peu particuliers de R que sont les facteurs, les dates et les heures, et les chaines de caractères et expressions régulières. Ceci finira notre tour du tidyverse avec forcats, lubridate et stringr, qui permettent de manipuler très facilement et lisiblement ces objets.
Le programme de l’atelier proposé sur des développements autour de R Markdown Créer des contenus pour R Markdown et shiny – Reporting tabulaire avec le package flextable Les fonctionnalités du package Les techniques utilisées pour l’intégration avec knitr Pratiquons : Créer une méthode d’impression tabulaire avec knitr et flextable pour les documents R Markdown – htmlwidgets : package ggiraph Les fonctionnalités du package Intégration dans le contexte shiny et dans le contexte R Markdown Implémentation du htmlwidget Pratiquons : Créer un simple htmlwidget Personnalisation des documents R Markdown Le triptyque CSS/JavaScript/HTML Exemples de thèmes xaringan, pagedown, blogdown Pratiquons : personnalisation d’un thème pagedown et d’un thème xaringan (https://github.
Christophe Botella nous a preparé un atelier pratique présentant le deep learning et comment le mettre en application avec le package {R-Mxnet}. Le code de l’atelier Et la présentation
Pierre et Benjamin nous ont préparé ‘quelque chose sur Shiny’: La présentation
Au cours d’une séance découverte un peu spécial, donnée lors de l’assemblée générale du département de mathématique et informatique de l’INRA, Mahendra nous a fait découvrir les potentialités de {plotly,ggplotly,crosscall}
Matthieu et Éric nous propose une séance sur {rSTAN}, l’interface R à la bibliothèque C++ Stan. Il s’agit d’algorithme inférence b yésienne utilisant une variante du Monte-Carlo Hamiltonien. On peut aussi faire de l’inférence fréquentiste par optimisation.
Dans la continuité de ce qui a été fait à Beg-meil](https://stateofther.github.io/finistR2018/atelier3_package_creation.html), je vous propose un tour d’horizon des bonnes pratiques et de l’ensemble des outils disponibles pour réaliser le développement d’un package R.
Séance dédiée à la préparation des satRday du lendemain: https://paris2019.satrdays.org Avec tous les bénévoles du groupe !
R package {bigstatsr} provides a special class of matrix whose data is stored on the disk instead of the RAM, but you can still access the data almost as if it were in memory.
Marco et Vincent vous proposent de prendre un peu de temps pour apprendre à se servir du package exams (disponible sur le CRAN) pour générer automatiquement des examens (QCM ou autres), corriger automatiquement ces examens, gérer un ensemble d’exercices collectivement, mettre en place une plateforme de e-learning.
Antoine, notre fanatique du tidyverse, nous propose de jeter un coup d’oeil à broom et rsample, des packages de tidymodels, pour travailler proprement (aka en format tibble) avec les sorties S3 des méthodes statistiques comme lm ou kmeans et faciliter l’utilisation des méthodes de rééchantillonage.
Un duo de choc, Raphaëlle et Marie, pour une séance dense sur laquelle était posée l’ombre du data imaginist – et vive Harry Potter. L’intégrale des slides
Les trois mousquetaires Timothée, Mathieu et Félix (a.k.a riri fifi loulou) proposent une séances complète d’introduction à Rcpp accompagné de travaux pratiques. Les documents de la séances: Introduction Rappel d’architecture machine Rappel en C++ RcppArmadillo Fonctions Astuces Pour compléter, voir la page du bootcamp finistR2018 dédiée aux modules Rcpp.
Séverine et Tristan nous proposent une introduction à quelques outils permettant de manipuler (en particulier charger) de “grosses” tables de données sous R. bigmemory for loading large matrices bigalgebra provides BLAS and LAPACK linear algebra sparklyr for interfacing R with Spark Apache Les documents de la séances
Sophie et Christophe nous proposent une séance complète sur le deep-learning et l’interfaçage existant sous R: Une brève histoire du Deep-Learning Une introduction au Deep-Learning sous R travaux pratiques
Antoine nous propose une introduction dense et déjà avancée en passant en revue l’ensemble du tidyverse Les slides Xaringan de Antoine
Éric nous présente les suites de l’introdution de Jessica aux très nombreux outils disponibles pour les statistiques spatiales sous R, notamment autour des packages sf et sp. slides et exercices, partie 1 slides et exercices, partie 2
Mahendra nous propose un retour d’expérience et quelques exercices sur le package DT pour la manipulation interactive de table. Les slides de Mahendra
Antoine nous propose une série de slides sur R markdown et Xaringan Les slides Xaringan de Antoine
Le groupe se réunit à AgroParisTech au cours d’ateliers mensuels de 3 heures autour d’un thème prédéfini. Chaque atelier est animé par quelques membres (généralement deux ou trois) qui se chargent de présenter les enjeux du thème, fournir le bagage méthodologique nécessaire, et proposer des travaux pratiques.
Nous pensons qu’il est important que l’ensemble des participants s’investissent dans l’animation pour préserver l’esprit des ateliers. Les places sont donc limitées à une trentaine par séance.
Pour participer à ces ateliers, un aspirant membre peut assister à une séance pour jauger la teneur des séances et évaluer le niveau des participants. Il s’engage ensuite à animer une séance en proposant un atelier.
La gestion du groupe (site web, liste de diffusion, bootcamp, recherche de financement, organisation des séances) est assurée par Julie Aubert, Julien Chiquet et Marie-Pierre Étienne. Vous pouvez nous contacter à l’adresse stateofr@gmail.com.
Dans le même esprit que les ateliers mensuels, les bootcamp Finist’R (c) sont des ateliers d’une semaine que nous avons organisés à Roscoff (en 2017, 2019, 2020, 2021, 2023, 2024), à Beg-Meil en 2018 et à Paimpont en 2022.
Les participants à State of the R sont issus de la recherche académique en statistique et dans des disciplines connexes (machine learning, optimisation, analyse numérique). Nous concourons dans notre quotidien au développement de nouvelles méthodes d’analyse de données, en nous appuyant sur des outils informatiques et de data science issus de la communauté de recherche académique et des grands acteurs du numériques. Notre position de chercheur(es) en statistique nous impose une veille constante sur les innovations et l’évolution permanente des outils offerts par la communauté (R
, Python
, Julia
, TensorFlow
, calcul GPU, etc.).
Dans ce contexte, R
/RStudio
sont nos références car nous pensons qu’ils sont des outils d’interface extraordinaires permettant d’intégrer toutes les phases de l’analyse (collecte, prétraitement, ajustement des modèles et calcul, écriture scientifique, diffusion des résultats) en communiquant facilement avec les nombreux outils et langages informatiques spécialisés pour chacune de ces phases: R
/RStudio
sont donc parfaitement adaptés à la recherche, à l’enseignement, au développement et à la diffusion des connaissance.
Fort de ce constat, le groupe State of the R a vu le jour fin août 2017 au cours d’un atelier “bootcamp” d’une semaine à Roscoff réunissant une dizaine de personnes. Sa liste de diffusion comporte désormais une soixantaine d’inscrits. Le groupe, devenu réseau méthodologique Mathématiques et Numérique (MathNum) en 2018, réunit des utilisateurs quotidiens du logiciel R
/RStudio
, dans la perspective de partager et d’approfondir les savoir-faire, d’échanger autour des dernières innovations et d’en favoriser la diffusion. Son objectif majeur est de définir un espace qui permette d’adopter un vocabulaire commun, des pratiques de programmation performantes et des modes de représentation standardisées pour une meilleure généricité des outils statistiques développés par notre communauté.