Configurer un laboratoire pour enseigner R sur Linux
Important
Azure Lab Services sera mis hors service le 28 juin 2027. Pour plus d’informations, consultez le guide de mise hors service.
Remarque
Cet article fait référence aux fonctionnalités disponibles dans les plans de labo, qui ont remplacé les comptes de labo.
R est un langage open source utilisé pour le calcul statistique et les graphiques. Il est utilisé à des fins d’analyse statistique, de la génétique à l’analyse des données financières, en passant par le traitement du langage naturel. Le langage R offre une expérience de ligne de commande interactive. RStudio est un environnement de développement intégré (IDE) interactif disponible pour le langage R. La version gratuite fournit des outils d’édition de code, une expérience de débogage intégrée et des outils de développement de package.
Cet article se concentre uniquement sur RStudio et R en tant que module pour une classe nécessitant l’utilisation du calcul statistique. Les types de classes Deep Learning et Python et Jupyter Notebooks configurent RStudio différemment. Chaque article décrit comment utiliser l’image du marketplace Data Science Virtual Machine pour Linux (Ubuntu) qui comprend de nombreux outils liés à la science des données, dont RStudio, préinstallés.
Configuration du laboratoire
Pour configurer ce labo, vous avez besoin d’un abonnement Azure et d’un plan labo pour commencer. Si vous n’avez pas d’abonnement Azure, créez un compte gratuit avant de commencer.
Configuration de ressource externe
Certaines classes requièrent que des fichiers, tels que des fichiers de données volumineux, soient stockés en externe.
Si vous optez pour un R Server partagé pour les étudiants, le serveur doit être configuré avant la création du laboratoire. Pour plus d’informations sur la configuration d’un serveur partagé, consultez Guide pratique pour créer un labo avec une ressource partagée dans Azure Lab Services. Pour obtenir des instructions sur la création d’un RStudio Server, consultez Télécharger RStudio Server pour Debian et Ubuntu et Accès à RStudio Server open source.
Si vous choisissez d’utiliser des ressources externes, vous devez vous connecter à votre réseau virtuel dans Azure Lab Services avec votre plan de labo.
Important
La mise en réseau avancée doit être activée lors de la création de votre plan de labo. Elle ne peut pas être ajoutée plus tard.
Paramètres du plan de labo
Une fois que vous disposez d’un abonnement Azure, vous pouvez créer un plan labo dans Azure Lab Services. Pour plus d’informations sur la création d’un plan labo, consultez notre tutoriel consacré à la configuration d’un plan labo. Vous pouvez aussi utiliser un plan de labo existant.
Activez les paramètres de plan de labo comme décrit dans le tableau suivant. Pour plus d’informations sur l’activation des images de la Place de marché Azure, consultez Spécification des images de la Place de marché Azure accessibles aux créateurs d’instances Lab.
Paramètre du plan de labo | Instructions |
---|---|
Images de la Place de marché | Activez l’image Ubuntu Server 18.04 LTS. |
Paramètres du labo
Pour obtenir des instructions sur la création d'un labo, consultez Tutoriel : Configurer un labo. Utilisez les paramètres suivants pour la création du labo.
Paramètre de labo | Valeur et description |
---|---|
Taille de la machine virtuelle | Petit GPU (calcul) |
Image de machine virtuelle | Ubuntu Server 18.04 LTS |
Activer la connexion Bureau à distance | Vous ne devez activer ce paramètre que si vous choisissez d’utiliser le protocole RDP. Ce paramètre n’est pas nécessaire si vous choisissez X2Go pour vous connecter à des machines de laboratoire. |
Si vous choisissez d’utiliser RDP à la place, vous devez vous connecter à la machine virtuelle Linux à l’aide de SSH et installer les packages RDP et GUI avant de publier le labo. Ensuite, les étudiants peuvent se connecter à la machine virtuelle Linux à l’aide de RDP ultérieurement. Pour plus d’informations, consultez Utiliser le Bureau à distance graphique pour des machines virtuelles Linux.
Configuration du modèle
Une fois la machine modèle créée, démarrez-la et connectez-vous à celle-ci pour installer R, RStudio Desktop et éventuellement X2Go Server.
Commençons pas mettre à jour apt et mettre à niveau les packages existants sur la machine.
sudo apt update
sudo apt upgrade
Installer X2Go Server
Si vous choisissez d’utiliser X2Go, installez le serveur. Vous devez commencer par vous connecter à une machine virtuelle de labo Linux à l’aide du protocole SSH pour installer le composant serveur. Cela fait, vous pouvez effectuer le reste de la configuration après connexion à l’aide du client X2Go.
L’installation par défaut de X2Go n’est pas compatible avec RStudio. Pour contourner ce problème, mettez à jour le fichier d’options x2goagent.
Modifiez le fichier
/etc/x2go/x2goagent.options
. N’oubliez pas de modifier le fichier en tant que sudo.- Supprimez le commentaire de la ligne :
X2GO_NXAGENT_DEFAULT_OPTIONS+=" -extension GLX"
- Commentez la ligne :
X2GO_NXAGENT_DEFAULT_OPTIONS+=" -extension GLX"
- Supprimez le commentaire de la ligne :
Redémarrez le serveur X2Go de façon à utiliser les nouvelles options.
sudo systemctl restart x2goserver
Vous pouvez également générer les bibliothèques requises en suivant les instructions fournies dans GLX workaround for X2Go.
Installer R
Il existe plusieurs façons d’installer R sur la machine virtuelle. Vous installez R à partir du référentiel CRAN (Comprehensive R Archive Network). Il fournit les versions les plus récentes de R. Une fois que ce référentiel est ajouté à notre machine, vous pouvez installer R et de nombreux autres packages associés.
Nous devons ajouter le référentiel CRAN. Les commandes sont modifiées conformément aux instructions rapides concernant les packages Ubuntu pour R.
#download helper packages
sudo apt install --no-install-recommends software-properties-common dirmngr
# download and add the signing key (by Michael Rutter) for these repos
sudo wget -q "https://cloud.r-project.org/bin/linux/ubuntu/marutter_pubkey.asc" -O /etc/apt/trusted.gpg.d/cran_ubuntu_key.asc
#add repository
sudo add-apt-repository "deb https://cloud.r-project.org/bin/linux/ubuntu bionic-cran40/"
Vous pouvez maintenant installer R en exécutant la commande suivante :
sudo apt install r-base
Installer RStudio
Maintenant que R est installé localement, vous pouvez installer l’environnement de développement intégré (IDE) RStudio. Nous installons la version gratuite de RStudio Desktop. Pour découvrir toutes les versions disponibles, consultez Téléchargements RStudio.
Importez la clé de signature de code pour RStudio.
sudo gpg --keyserver keyserver.ubuntu.com --recv-keys 3F32EE77E331692F
Téléchargez le fichier Debian Linux Package file (.deb) for R Studio pour Ubuntu. Le fichier est au format
rstudio-{version}-amd64.deb
. Par exemple :export rstudiover="1.4.1717" wget --quiet -O rstudio.deb https://download1.rstudio.org/desktop/bionic/amd64/rstudio-$rstudiover-amd64.deb
Utilisez gdebi pour installer RStudio. Veillez à utiliser le chemin d’accès au fichier pour indiquer à apt que vous installez un fichier local.
sudo apt install gdebi-core echo "y" | gdebi rstudio.deb –quiet
Packages CRAN
Il est maintenant temps d’installer tous les packages cran souhaités. Commencez par ajouter le référentiel actuel R 4.0 ou ’c2d4u’ ultérieur.
sudo add-apt-repository ppa:c2d4u.team/c2d4u4.0+
Utilisez la commande install.packages(“package name”)
dans une session R interactive, comme indiqué dans l’article quick list of useful R packages. Vous pouvez également utiliser l’option de menu Outils -> Installer des packages dans RStudio.
Si vous avez besoin d’aide pour trouver un package, consultez la liste des packages par tâche ou la liste alphabétique des packages.
Cost
Penchons-nous sur un exemple d’estimation du coût pour ce cours. Supposons que vous ayez une classe de 25 élèves. Chaque élève dispose de 20 heures de cours programmées. Chaque élève dispose également d'un quota de 10 heures pour les devoirs et activités à la maison en dehors des heures de cours programmées. La taille de machine virtuelle que nous avons choisie était GPU de petite taille (calcul), soit 139 unités de laboratoire.
25 étudiants × (20 heures planifiées + 10 heures de quota) × 139 unités Lab × 0,01 USD par heure = 1042,5 USD
Important
L’estimation du coût est fournie à titre d’exemple uniquement. Pour connaître les tarifs actuels, consultez Tarifs Azure Lab Services.
Étapes suivantes
L’image du modèle peut à présent être publiée dans le labo. Pour plus d’informations, consultez Publier le modèle de machine virtuelle.
Au fil de la configuration de votre instance Lab, consultez les articles suivants :