Créer un pipeline complet pour en apprentissage automatique avec {tidymodels}
Antoine Bichat et Julie Aubert ont rejoué le tutoriel donné aux rencontres R 2024 pour apprendre à créer un"pipeline" complet pour l’apprentissage automatique avec {tidymodels}
.
Résumé :
{Tidymodels}
regroupe un ensemble de packages facilitant l’utilisation de méthodes d’apprentissage statistique (telles que les forêts aléatoires, modèles linéaires bayésien ou non…) dans un cadre unifié et “tidy”. Ce tutoriel montre comment utiliser ces packages pour prétraiter les données, construire, entraîner et évaluer un modèle, optimiser des hyperparamètres et tout ce qu’il est utile de savoir pour mener de bout en bout un projet d’apprentissage statistique supervisé.
Pré-requis :
Pour profiter au maximum de ce tutoriel, merci de vérifier que vous avez une version de R >= 4.1 disponible ici, une version récente de RStudio et d’installer au préalable les packages R utiles à l’aide de la commande suivante :
install.packages(c("tidyverse", "tidymodels",
"glmnet", "ranger", "xgboost",
"finetune", "workflowsets", "corrr", "vip",
"ggforce", "ggrain"))