Google Colab rend la science des données, l'apprentissage en profondeur, les réseaux de neurones et l'apprentissage automatique accessibles aux chercheurs individuels qui ne peuvent pas se permettre une infrastructure de calcul coûteuse.

L'apprentissage automatique et la science des données sont les deux nouvelles technologies dans lesquelles tous les informaticiens de la nouvelle génération veulent exceller. Il existe de nombreux cours d'apprentissage en ligne, des conférences gratuites et des guides pratiques en ligne sur ML et science des données.

Mais, s'entraîner sur des projets devient une contrainte puisque vous avez besoin de PC haut de gamme pour de telles charges de travail. La réponse à ce problème est Colaboratoire Google ou Colab, en bref. Continuez à lire pour obtenir l'examen ultime de Google Colab.       

What Is Google Colab?

YouTube vidéo

Colab est un produit de type Jupyter Notebook de Google Research. Un développeur de programme Python peut utiliser ce bloc-notes pour écrire et exécuter des codes de programme Python aléatoires simplement à l'aide d'un navigateur Web.

En un mot, Colab est une version hébergée dans le cloud de Jupyter Notebook. Pour utiliser Colab, vous n'avez pas besoin d'installer et d'exécuter ou de mettre à niveau votre matériel informatique pour répondre aux exigences de charge de travail intensives du CPU/GPU de Python. De plus, Colab vous donne un accès gratuit à l'infrastructure informatique comme le stockage, la mémoire, la capacité de traitement, les unités de traitement graphique (GPU) et les unités de traitement de tenseur (TPU).

Google a spécialement programmé cet outil de codage Python basé sur le cloud en gardant à l'esprit les besoins des programmeurs d'apprentissage automatique, des analystes de données volumineuses, des scientifiques des données, des chercheurs en IA et des apprenants Python.

La meilleure partie est un bloc-notes de code pour tous les composants nécessaires pour présenter un apprentissage automatique complet ou science des données projet aux superviseurs ou aux parrains du programme. Par exemple, votre bloc-notes Colab peut contenir des codes exécutables, des codes Python en direct, du texte enrichi, HTML, LaTeX, des images, des visualisations de données, des graphiques, des tableaux, etc.     

What Does Google Colab Do?

Que fait Google Colab

Google Colab est simplement une représentation en ligne de Jupyter Notebook. Alors que Jupyter Notebook doit être installé sur un ordinateur et ne peut utiliser que les ressources de la machine locale, Colab est une application cloud à part entière pour Python codage.

Vous pouvez écrire des codes Python à l'aide de Colab sur vos navigateurs Web Google Chrome ou Mozilla Firefox. Vous pouvez également exécuter ces codes sur le navigateur sans avoir besoin d'un environnement d'exécution ou d'une interface de ligne de commande.

De plus, vous pouvez donner votre projet Python cahier un aspect professionnel en ajoutant des équations mathématiques, des graphiques, des tableaux, des images et d'autres graphiques. De plus, vous pouvez coder des visualisations de données en Python, et Colab restituera le code dans un élément visuel.

De plus, Colab vous permet de réutiliser les fichiers Jupyter Notebook de GitHub. En dehors de cela, vous pouvez également importer des projets d'apprentissage automatique et de science des données compatibles à partir d'autres sources. Colab traite efficacement les ressources importées pour afficher des codes Python propres et sans erreur.    

Best Features of Google Colab

YouTube vidéo

GPU et TPU

Les utilisateurs gratuits de Colab bénéficient d'un accès gratuit aux runtimes GPU et TPU pendant 12 heures maximum. Son exécution GPU est livrée avec un processeur Intel Xeon à 2.20 GHz, 13 Go de RAM, un accélérateur Tesla K80 et 12 Go de VRAM GDDR5.

Le runtime TPU se compose d'un processeur Intel Xeon à 2.30 GHz, de 13 Go de RAM et d'un TPU cloud avec 180 téraflops de puissance de calcul.

Avec Colab Pro ou Pro+, vous pouvez mettre en service plus de processeurs, de TPU et de GPU pendant plus de 12 heures.  

Partage de bloc-notes

Le cahier de code Python n'a jamais été accessible avant Colab. Désormais, vous pouvez créer des liens partageables pour les fichiers Colab enregistrés sur votre Google Drive. Maintenant, partagez le lien avec le collaborateur qui souhaite travailler avec vous. De plus, vous pouvez également inviter des programmeurs à travailler avec vous en utilisant les e-mails Google. 

Installation spéciale de la bibliothèque

Colab vous permet d'installer des bibliothèques non collaboratives (AWS S3, GCP, SQL, MySQL, etc.) qui ne sont pas disponibles dans les extraits de code. Tout ce que vous avez à faire est d'ajouter un code à une ligne avec les préfixes de code suivants : 

!pip install (example: !pip install matplotlib-venn)
!apt-get install (example: !apt-get -qq install -y libfluidsynth1)

Bibliothèques préinstallées

Google Colab propose plusieurs pré-installés bibliothèques afin que vous puissiez importer la bibliothèque requise à partir des extraits de code. Ces bibliothèques incluent NumPy, Pandas, Matplotlib, PyTorch, TensorFlow, Keras et d'autres bibliothèques ML. 

Codage collaboratif

Codage collaboratif

Le co-codage est indispensable pour les projets de groupe. Cela aide votre équipe à franchir des jalons plus tôt que prévu. Si votre équipe a besoin d'une collaboration en temps réel sur des projets de ML et de science des données, Google Collaborative est l'outil qu'il vous faut.

Envoyez simplement un lien modifiable avec les collaborateurs ou invitez des collaborateurs pour le codage de groupe. L'ensemble du bloc-notes Python se met à jour automatiquement au fur et à mesure que les codes d'équipe, et vous avez l'impression de travailler sur des feuilles de calcul ou des documents Google partagés.    

cloud Storage

Google Colab utilise votre quota de stockage Google Drive à des fins d'enregistrement de fichiers. Par conséquent, vous pouvez reprendre le travail à partir de n'importe quel ordinateur sur lequel vous pouvez accéder à votre compte Google Drive.

Le stockage en nuage fonctionne également comme une sauvegarde de vos données en cas de sinistre.   

Intégration GitHub

Vous pouvez lier votre GitHub compte avec Google Colab pour importer et exporter en toute transparence des fichiers de code. Pour l'importation, vous pouvez appuyer sur Ctrl+O et cliquer sur l'onglet GitHub pour obtenir les fichiers de code. Au contraire, cliquez simplement sur Enregistrer une copie sur GitHub dans le menu Fichier pour envoyer des fichiers à GitHub. 

Sources de données multiples

Google Colaboratory prend en charge diverses sources de données pour vos projets de formation en ML et en IA. Par exemple, vous pouvez importer des données depuis une machine locale, monter Google Drive sur une instance Colab, récupérer des données distantes et cloner le référentiel GitHub dans Colab.  

Contrôle de version automatique

Comme Google Sheets et Docs, Google Colab dispose également d'un suivi d'historique exhaustif. Le module suit toutes les modifications apportées depuis la création du fichier. Vous pouvez accéder aux journaux à partir du menu Fichier et cliquer sur l'option Historique des révisions.  

Why Should You Choose Google Colab?

Pourquoi devriez-vous choisir Google Colab
  • Google Colaboratory est un outil basé sur le cloud. Vous pouvez commencer à coder de fantastiques modèles de ML et de science des données à l'aide d'un navigateur Chrome. 
  • Colab est gratuit avec des ressources limitées. Cependant, vous ne devez pas vous attendre à pouvoir stocker indéfiniment vos modèles d'intelligence artificielle ou d'apprentissage automatique sur l'infrastructure gratuite de Colab.
  • Si vous savez travailler sur Jupyter, vous n'avez pas besoin de passer par une courbe d'apprentissage sur Google Colaboratory.
  • Accès gratuit aux GPU et aux TPU pour des modèles étendus de science des données et d'apprentissage automatique.
  • Il est livré avec des bibliothèques de science des données préinstallées et populaires.
  • Les codeurs peuvent facilement partager le bloc-notes de code avec des collaborateurs pour un codage en temps réel.
  • Étant donné que Google héberge le bloc-notes sur Google Cloud, vous n'avez pas à vous soucier du contrôle de version et du stockage des documents de code.
  • S'intègre facilement à GitHub. 
  • Vous pouvez entraîner l'IA à l'aide d'images.
  • Vous pouvez également former des modèles sur l'audio et le texte.
  • Les chercheurs peuvent également exécuter des programmes TensorFlow sur Colab.       

How to Use Google Colab

Comment utiliser Google Colab

Vous pouvez utiliser Google Colaboratory si vous remplissez les conditions minimales suivantes : 

  • Un compte Google pour découvrir toute la commodité de Colab.
  • Un ordinateur qui peut exécuter le dernier navigateur Google Chrome ou Mozilla Firefox
  • Google recommande Chrome pour Colab.
  • Acceptez les conditions d'utilisation des données de Google.

Vous pouvez accéder à Colaboratoire Google depuis son site officiel. Colab est gratuit ; cependant, les allocations de ressources limitées ne sont pas toujours garanties. Si vous avez besoin de plus de vitesse et de capacités de traitement avec des ressources garanties, vous pouvez obtenir Collaboration Pro ou Pro+.

Collaboration Pro

Pour certains modèles de science des données et d'apprentissage automatique adaptés à Colab, vous pouvez consulter Banque de graines Google.   

The Differences Between Google Colab and Jupyter Notebook

Fonctionnalités du document de codeColaboratoire GoogleJupyter Notebook
Visualisation instantanée du fichier de codeOuiNon
Partage de documents de codeOuiNon
Bibliothèques installéesOuiNon
Cloud hébergementOuiNon
Synchronisation des fichiersOuiNon

#1. Colab ne nécessite aucune installation de logiciel sur la machine locale. Au contraire, Jupyter Notebook nécessite des installations logicielles et des ressources machines locales pour le calcul.

#2. Comme Colab est basé sur le cloud, vous bénéficiez d'un contrôle de version automatique. De plus, Google Drive continue d'enregistrer automatiquement le bloc-notes Python. En revanche, sur Jupyter Notebook, vous devez enregistrer périodiquement le notebook et gérer le contrôle de version.

#3. Les fichiers Colab sont disponibles sur Google Drive à des fins de sauvegarde. D'autre part, les fichiers Jupyter Notebook ne sont pas sauvegardés automatiquement.

#4. Vous pouvez envoyer vos fichiers Colab à n'importe qui, même à un client qui n'est pas un data scientist. Ils peuvent facilement ouvrir le document sur Google Colab et examiner le contenu. Aucune installation de logiciel n'est requise de la part du destinataire.

Au contraire, le destinataire doit installer et exécuter Jupyter Notebook pour lire votre projet. Par conséquent, partager ce fichier avec des clients non spécialistes de la science des données devient un défi.

#5. Google Colaboratory est livré avec les bibliothèques requises pour les projets de science des données et d'apprentissage automatique. Il vous donne également une certaine quantité de CPU, de RAM, de GPU et de TPU sur le cloud. Ainsi, vous économisez du temps et de l'argent.

En revanche, vous devez sourcer et installer toutes les bibliothèques requises pour votre projet si vous travaillez sur l'application Jupyter Notebook. L'installation d'autant de bibliothèques consomme également les ressources CPU, RAM et GPU de la machine locale.         

Executing Common Tasks on Google Colab

Créer un carnet

Créer un bloc-notes sur Google Colab
  • Accédez au portail Google Colab et voyez "Bienvenue dans Colab !"
  • Dans le menu du haut, cliquez sur Déposez le.
  • Dans le menu contextuel Fichier, choisissez Nouveau cahier
  • Votre nouveau bloc-notes Python est prêt. Vous pouvez renommer le fichier notebook.

Charger et télécharger des fichiers

Vous pouvez importer des codes Python locaux dans Colab en procédant comme suit :

Importer un bloc-notes dans Google Colab
  • Dans le menu du haut, cliquez sur Déposez le.
  • Un menu contextuel s'ouvrira avec de nombreuses options.
  • Find Importer un bloc-notes et cliquez dessus.
  • Vous verrez maintenant une console superposée avec des options telles que Exemples, Google Drive, GitHub et Télécharger. 
  • Cliquez sur n'importe quel onglet et sélectionnez le contenu du code que vous souhaitez télécharger. 

Le téléchargement de votre projet en cours ou terminé est également très facile. Voici les étapes: 

Télécharger le bloc-notes depuis Google Colab
  • Cliquez sur le Déposez le menu situé dans la barre de menu supérieure.
  • Passez le curseur sur Télécharger.
  • Un menu contextuel s'ouvrira avec deux options de format de fichier de téléchargement : .ipynb et .py.
  • Vous pouvez choisir un format préféré et télécharger le fichier. 

Accéder à GitHub

L'accès à GitHub est un jeu d'enfant dans Colab. Voici ce que vous pouvez faire :

Accéder au référentiel GitHub depuis Colaboratory
  • Cliquez Déposez le dans la barre de menu supérieure.
  • Sélectionnez Importer un bloc-notes dans le menu contextuel.
  • Une console avec un GitHub l'onglet s'ouvrira.
  • Vous pouvez également appuyer sur Ctrl + A pour accéder à la même console.
  • Les options de recherche GitHub sont l'URL GitHub, le nom d'utilisateur et le nom de l'organisation.

Accéder aux fichiers locaux

  • Presse Ctrl + A sur votre nouveau notebook Colab.
  • Sélectionnez le Téléchargement onglet sur la console qui apparaît.
  • Cliquez Choisissez Fichier pour localiser le fichier local que vous souhaitez ouvrir sur Colab.  

Accédez à Google Drive

Accédez à Google Drive
  • Cliquez Déposez le dans le menu supérieur.
  • Vous pouvez sélectionner Cahier ouvert or Importer un bloc-notes.
  • Une console apparaîtra avec un onglet pour Google Drive.
  • Cliquez dessus pour accéder aux fichiers de Google Drive. 

Si vous souhaitez installer Google Drive sur votre instance Colab, procédez comme suit : 

Montez Google Drive sur votre instance Colab
  • Cliquez sur Déposez le situé dans le volet de navigation de gauche.
  • Sélectionnez le Monter le lecteur commander.
  • Sur la notification qui s'affiche, sélectionnez Connectez-vous à Google Drive.
  • Google vous demandera de choisir un compte pour l'autorisation.

Enregistrer et importer depuis Google Sheets

Vous pouvez enregistrer vos données de bloc-notes sans effort dans un fichier Google Sheets pour un traitement ultérieur. Pour ce faire, essayez ces étapes :

Accéder à Google Sheets
  • Cliquez Extraits de code bouton dans le coin inférieur gauche.
  • Un volet de navigation s'ouvrira sur le côté droit.
  • Catégorie Sheets dans le filtre, et vous trouverez La sauvegarde des données et un Importation de données extraits de code.
  • Double-cliquez sur le titre pour inclure le code dans le cahier.

Accéder à AWS S3

Vous pouvez accéder aux fichiers et aux actifs de codage à partir de plates-formes de stockage cloud telles qu'AWS S3 et Azure Blob à l'aide de compartiments de stockage cloud. 

Accéder à AWS S3

Pour ce faire, vous devez installer ByteHub, qui dispose des fonctionnalités de chargement et de sauvegarde des données sur le stockage en nuage. Vous pouvez exécuter le code suivant :

!pip install -q bytehub[aws] 

Accéder aux ensembles de données Kaggle

Accéder aux ensembles de données Kaggle
  • Allez sur le compte Kaggle et cliquez sur Faire expirer le jeton d'API du Rubrique API pour supprimer les anciens jetons.
  • Créer Nouveau jeton d'API pour obtenir le kaggle.json sur l'ordinateur local.
  • Utilisez maintenant le code suivant pour installer Kaggle :
!pip install -q kaggle
  • Maintenant, chargez le fichier Kaggle.json dans la base de code Python en suivant une pratique de codage standard.

Mot de la fin

Maintenant que vous avez suivi une discussion approfondie sur l'application Google Collaboratory, vous devriez être en mesure de démarrer votre apprentissage, votre formation ou votre pratique de projets d'apprentissage automatique. Google Colab est une application cloud vraiment pratique pour ceux qui aiment les notebooks Jupyter.  

Vous pouvez également être intéressé par certains populaires ensembles de données ouverts pour la science des données projets.