Programme > Tutoriels
|
Claire Della-Vedova
|
DellaData (prestations et formations méthodologie / statistiques / langage R) |
|
|
Introduction pratique à R : les fondamentaux pour organiser, analyser et visualiser
Ce tutoriel est destiné aux débutants sans expérience préalable ainsi qu’aux utilisateurs occasionnels souhaitant maîtriser les bases de l’analyse et de la visualisation de données. Durant ces deux heures, vous serez guidé étape par étape dans l’environnement RStudio, apprenant à manipuler vos données de manière simple et efficace.
Nous débuterons par une introduction à l’organisation des projets sous R, un outil essentiel pour structurer vos fichiers et scripts de manière optimale. Vous explorerez ensuite les quatre fenêtres principales de RStudio (console, script, environnement, graphiques) pour comprendre comment interagir avec vos données.
Vous découvrirez les premiers éléments du langage R, vous familiarisant avec la syntaxe de base : création de variables, utilisation de fonctions simples, et manipulation des objets essentiels tels que les vecteurs et les dataframes. Vous apprendrez également à importer des données au format CSV et Excel (XLSX), les formats les plus couramment utilisés dans l’analyse de données.
Enfin, vous serez initié à la création de vos premiers graphiques grâce au package esquisse, un outil interactif qui facilite la création de visualisations claires et intuitives, sans nécessiter une maîtrise approfondie de R.
Prérequis : Seules des connaissances de base de l’outil informatique sont nécessaires : création de dossier, navigation dans l’arborescence, utilisation du copier-coller, et du pack office.
Durée : 2h
À réaliser avant de venir au tutoriel :
- installer R
- installer RStudio
- installer l’application XQuartz pour celles et ceux qui sont sous macOS : https://www.xquartz.org/
|
|
Vincent Guyader Assisté de Colin Fay
|
CTO chez ThinkR |
|
|
Conception d'applications Shiny avec {golem}
{golem} est un framework puissant qui permet de structurer le code Shiny, facilitant ainsi la création d'applications robustes, facilement déployables et maintenables sur le long terme. En transformant une application Shiny en package R, {golem} offre de nombreux avantages, tels que l'intégration d'outils de documentation, de tests unitaires et de gestion des dépendances, assurant ainsi une qualité et une fiabilité accrues du code.
Ce tutoriel est pensé à la fois pour les débutants en Shiny et pour les utilisateurs expérimentés cherchant à adopter de meilleures pratiques de développement. Nous commencerons par un rappel des concepts fondamentaux de Shiny, avant de plonger dans les spécificités de {golem}. Les participants apprendront à structurer leur projet, à modulariser le code en séparant l'interface utilisateur et la logique serveur, et à utiliser les fonctionnalités avancées de {golem} pour améliorer la maintenabilité et la scalabilité de leurs applications.
Ce tutoriel vise à fournir une méthode de travail rigoureuse, permettant de développer des applications Shiny sur lesquelles on peut compter, tout en favorisant une collaboration efficace au sein des équipes de développement.
Prérequis : maîtrise de base de la programmation en langage R
Durée : 2h
À réaliser avant de venir au tutoriel : des instructions pour la connexion à l'environnement utilisé (bakacode) seront envoyées aux inscrits avant le début du tutoriel
|
|
Toby Dylan Hocking
|
Professeur Agrégé, Département d'informatique, Université de Sherbrooke, Québec, Canada |
|
|
Tutoriel {data.table}
{data.table} est un package R qui permet le traitement efficace de grands jeux de données. Il inclut des fonctions pour la lecture et l'écriture de fichiers CSV, l'agrégation, la restructuration, la jointure, etc. Par rapport aux autres logiciels avec ces fonctions, l'utilisation de {data.table} peut être 10x plus efficace en temps de calcul et en utilisation de mémoire. Il est aussi très facile à installer (il ne dépend pas d'autres packages) et à mettre à jour (les nouvelles versions de {data.table} sont compatibles avec les anciennes). Sur CRAN depuis 2006, il est très utilisé, avec plus de 1500 autres packages qui en dépendent.
Depuis 2024, il y a même des traductions en français, pour les messages d'erreur, ainsi que les vignettes. Ce tutoriel va discuter de :
- l'utilisation du package (fonctions de base et avancées),
- son efficacité relative aux autres packages (tidyverse, pandas, etc),
- la manière d'écrire un package qui dépend de {data.table},
- quelques remarques sur la communauté de développeurs de {data.table} qui est très ouverte aux contributions du public.
Prérequis : maîtrise de base de la programmation avec le langage R Durée : 2h À réaliser avant de venir au tutoriel : installer R version 3.3.0 ou supérieure et ensuite utiliser la commande install.packages("data.table") Informations complémentaires : Page web en anglais : http://r-datatable.com/ Vignette d'introduction en français : https://rdatatable.gitlab.io/data.table/articles/fr/datatable-intro.html Code source du tutoriel : https://github.com/tdhock/2023-10-LatinR-data.table
|
|
Christophe Regouby
|
Airbus |
|
|
{torch}, {tabnet} et l'apprentissage profond par l'usage
R offre une interface native à l'environnement d'apprentissage profond torch. Et au-delà, au mlverse, un univers très complet de paquetages pour adapter les données tabulaires, les images, les textes, les modèles publics du hub huggingface, et bien d'autres.
Venez découvrir cet univers par l'usage, par un atelier pratique qui couvrira tout d'abord les généralités de torch avec les avantages et les inconvénients de cette librairie, incluant les arcanes de l'installation sur vos GPUs, la manipulation de tenseurs, etc.
On entrera en profondeur dans les modèles {tabnet} de classification ou de régression sur des données tabulaires, leur entraînement et leur optimisation, l'intégration dans l'environnement {tidymodels}, la gestion des valeurs manquantes...
On basculera ensuite dans le monde des modèles de langage avec le réentraînement de GPT-2 sur votre machine, l'usage et la modification des grands modèles de langage d'huggingface, le fine-tunning d'un LLM par l'ajout d'un LoRA.
On évoquera enfin le monde de la vision par ordinateur avec l'entraînement d'un modèle de segmentation d'image.
L'atelier inclut la théorie strictement nécessaire et beaucoup de pratique pour apprendre à tirer le meilleur parti des ressources matérielles disponibles tout en utilisant des modèles à l'état de l'art.
Prérequis : maîtrise intermédiaire de la programmation avec le langage R, et du machine-learning.
Durée : 2h
À réaliser avant de venir au tutoriel :
- Installer R 4.4.0 ou supérieur et un IDE confortable, par exemple RStudio desktop.
- Installer le package {usethis} : install.packages("usethis")
- Installer les exercices du tutoriel :
usethis::use_course("cregouby/Tutoriel_torch")
- Installer les prérequis du tutoriel : source("00_installation.R")
Informations complémentaires : site web de {torch} : https://torch.mlverse.org/
|
|