Analyse de données multivariées

Présentation de {pyPLNmodels}

Bastien Batardière nous présente le package python {pyPLNmodels}, conçu spécifiquement pour l’analyse de données de comptage. Ce package repose sur les modèles PLN et PLN-PCA (Chiquet, Mariadassou, and Robin 2018, 2021), qui font l’hypothèse d’une couche latente gaussienne. Grâce aux lois a posteriori, il permet d’extraire cette couche gaussienne et d’effectuer une ACP probabiliste adaptée aux données de comptage. Le package est accompagné d’un ensemble d’outils de visualisation pour faciliter l’interprétation des résultats.

Utilisez le Getting_started.ipynb et c’est parti !

Le support introductif est ici

Atelier

Cette séance sous forme d’atelier a pour objectif de tester différents packages permettant de traiter des données de présence/absence ou d’abondance multivariées notamment en écologie, comme (liste non exhaustive)

Packages R

Le package [gllvm-package; Niku, Hui, et al. (2019)] utilise l’implémentation d’une méthode variationnelle via {TMB} (Kristensen et al. 2016) ou une méthode de Laplace d’approximation pour l’estimation. Pour plus de détails, allez voir Niku et al. (2021); Niku, Brooks, et al. (2019).

is a model-based approach for analyzing community ecological data (Tikhonov et al. 2022) (Ovaskainen et a.2017a).

Données Présence/Absence

Nous aurons au moins un jeu de données à disposition du type présence de différentes espèces de plantes sur différentes périodes sur différentes sites, accompagnées de covariables définissant le site.

Nous pourrons utiliser les données exemples du chapitre Modèles à facteurs latents, un outil de réduction de dimension pour les modèles de distribution d’espèce joints à récupérer dans ici

Données pieds d’arbre

Données publiées sur zenodo

Données pieds d’arbre 2009-2012 Données pieds d’arbre 2014-2018

References

Chiquet, Julien, Mahendra Mariadassou, and Stéphane Robin. 2018. “Variational Inference for Probabilistic Poisson PCA.” The Annals of Applied Statistics 12: 2674–98. https://projecteuclid.org/journals/annals-of-applied-statistics/volume-12/issue-4/Variational-inference-for-probabilistic-Poisson-PCA/10.1214/18-AOAS1177.full.

———. 2021. “The Poisson-Lognormal Model as a Versatile Framework for the Joint Analysis of Species Abundances.” Frontiers in Ecology and Evolution. https://doi.org/10.3389/fevo.2021.588292.

Kristensen, Kasper, Anders Nielsen, Casper W. Berg, Hans Skaug, and Bradley M. Bell. 2016. “TMB: Automatic Differentiation and Laplace Approximation.” Journal of Statistical Software 70 (5): 1–21. https://doi.org/10.18637/jss.v070.i05.

Niku, Jenni, Wesley Brooks, Riki Herliansyah, Francis K. C. Hui, Sara Taskinen, and David I. Warton. 2019. “Efficient Estimation of Generalized Linear Latent Variable Models.” PLoS ONE 14 (May). https://doi.org/10.1371/journal.pone.0216129.

Niku, Jenni, Francis K. C. Hui, Sara Taskinen, and David I. Warton. 2019. “Gllvm - Fast Analysis of Multivariate Abundance Data with Generalized Linear Latent Variable Models in r.” Methods in Ecology and Evolution 10: 2173–82.

———. 2021. “Analyzing Environmental-Trait Interactions in Ecological Communities with Fourth-Corner Latent Variable Models.” Environmetrics 32: 1–17.

Tikhonov, Gleb, Otso Ovaskainen, Jari Oksanen, Melinda de Jonge, Oystein Opedal, and Tad Dallas. 2022. Hmsc: Hierarchical Model of Species Communities. https://CRAN.R-project.org/package=Hmsc.

rédacteur

Related