Google Colab maakt data science, deep learning, neurale netwerken en machine learning toegankelijk voor individuele onderzoekers die zich geen dure computerinfrastructuur kunnen veroorloven.
Machine learning en data science zijn de twee nieuwe technologieën waarin alle nieuwe generatie computerwetenschappers willen uitblinken. Er zijn veel online cursussen, gratis lezingen en online how-to gidsen over ML en data science.
Maar het oefenen op projecten wordt een beperking omdat u high-end pc’s nodig hebt voor dergelijke workloads. Het antwoord op dit probleem is Google Colaboratory of kortweg Colab. Lees verder voor de ultieme recensie van Google Colab.
Wat is Google Colab?
Colab is een Jupyter-notitieblokachtig product van Google Research. Een Python-programmamaker kan dit notitieblok gebruiken om willekeurige Python-programmacodes te schrijven en uit te voeren met behulp van een webbrowser.
In een notendop is Colab een cloud-hosted versie van Jupyter Notebook. Om Colab te gebruiken, hoeft u geen runtime te installeren of uw computerhardware te upgraden om aan de CPU/GPU-intensieve werkbelastingseisen van Python te voldoen. Bovendien geeft Colab u gratis toegang tot computerinfrastructuur zoals opslag, geheugen, verwerkingscapaciteit, grafische verwerkingseenheden (GPU’s) en tensorverwerkingseenheden (TPU’s).
Google heeft deze cloud-gebaseerde Python-codeertool speciaal geprogrammeerd met het oog op de behoeften van machine learning-programmeurs, big data-analisten, datawetenschappers, AI-onderzoekers en Python-leerlingen.
Het beste deel is één codeblok voor alle onderdelen die nodig zijn om een compleet machine learning- of data science-project te presenteren aan programmabegeleiders of sponsors. Uw Colab-notebook kan bijvoorbeeld uitvoerbare codes, live Python-codes, rijke tekst, HTML, LaTeX, afbeeldingen, datavisualisaties, grafieken, tabellen en nog veel meer bevatten.
Wat doet Google Colab?

Google Colab is gewoon een online weergave van Jupyter Notebook. Terwijl Jupyter Notebook op een computer geïnstalleerd moet worden en alleen lokale machineresources kan gebruiken, is Colab een volwaardige cloud-app voor Python-codering.
U kunt Python-codes schrijven met Colab in uw Google Chrome of Mozilla Firefox webbrowsers. U kunt die codes ook in de browser uitvoeren zonder dat u een runtime-omgeving of opdrachtregelinterface nodig hebt.
Bovendien kunt u uw Python projectnotebook een professionele uitstraling geven door wiskundige vergelijkingen, grafieken, tabellen, afbeeldingen en andere grafische elementen toe te voegen. Bovendien kunt u datavisualisaties in Python coderen, en Colab zal de code in een visueel bestand weergeven.
Bovendien kunt u met Colab Jupyter Notebook-bestanden van GitHub hergebruiken. Daarnaast kunt u ook compatibele machine learning- en data science-projecten uit andere bronnen importeren. Colab verwerkt de geïmporteerde assets efficiënt om schone en foutloze Python-codes weer te geven.
Beste functies van Google Colab
GPU’s en TPU’s
Gratis Colab-gebruikers krijgen gratis toegang tot GPU- en TPU-runtimes voor maximaal 12 uur. De GPU runtime wordt geleverd met een Intel Xeon CPU @2,20 GHz, 13 GB RAM, Tesla K80 versneller en 12 GB GDDR5 VRAM.
De TPU runtime bestaat uit een Intel Xeon CPU @2,30 GHz, 13 GB RAM en een cloud TPU met 180 teraflops aan rekenkracht.
Met Colab Pro of Pro kunt u meer CPU’s, TPU’s en GPU’s voor meer dan 12 uur in gebruik nemen.
Notebook delen
Het Python-notitieboek was nooit eerder toegankelijk dan Colab. Nu kunt u deelbare links maken voor Colab-bestanden die zijn opgeslagen op uw Google Drive. Deel nu de link met de medewerker die met u wil samenwerken. Bovendien kunt u ook programmeurs uitnodigen om met u samen te werken via Google e-mails.
Speciale bibliotheek installeren
Met Colab kunt u niet-Colaboratorium bibliotheken installeren (AWS S3, GCP, SQL, MySQL, enz.) die niet beschikbaar zijn in de Code snippets. Het enige wat u hoeft te doen is een one-liner code toevoegen met de volgende codevoorvoegsels:
pip install (voorbeeld: pip install matplotlib-venn)
apt-get install (voorbeeld: apt-get -qq install -y libfluidsynth1)
Vooraf geïnstalleerde bibliotheken
Google Colab biedt meerdere voorgeïnstalleerde bibliotheken, zodat u de gewenste bibliotheek vanuit Code snippets kunt importeren. Dergelijke bibliotheken zijn onder andere NumPy, Pandas, Matplotlib, PyTorch, TensorFlow, Keras en meer ML-bibliotheken.
Co-coding in samenwerking

Co-coding is onmisbaar voor groepsprojecten. Het helpt uw team om mijlpalen eerder te voltooien dan het verwachte tijdsbestek. Als uw team behoefte heeft aan samenwerking in realtime bij ML- en data science-projecten, dan is Google Collaborative precies het juiste hulpmiddel.
Stuur gewoon een bewerkbare link naar de medewerkers of nodig medewerkers uit voor groepscodering. Het hele Python-notitieblok wordt automatisch bijgewerkt terwijl het team codeert, en u krijgt het gevoel dat u op gedeelde Google Sheets of Documenten werkt.
Cloudopslag
Google Colab gebruikt uw Google Drive opslagquota voor het opslaan van bestanden. U kunt uw werk dus hervatten vanaf elke computer waarop u toegang hebt tot uw Google Drive account.
Cloudopslag fungeert ook als back-up van uw gegevens bij eventuele rampen.
GitHub Integratie
U kunt uw GitHub account koppelen aan Google Colab om naadloos codebestanden te importeren en exporteren. Voor het importeren kunt u op Ctrl O drukken en op het GitHub tabblad klikken om codebestanden op te halen. Daarentegen klikt u gewoon op Een kopie naar GitHub opslaan in het menu Bestand om bestanden naar GitHub te sturen.
Meerdere gegevensbronnen
Google Colaboratory ondersteunt verschillende gegevensbronnen voor uw ML- en AI-trainingprojecten. U kunt bijvoorbeeld gegevens importeren van een lokale machine, Google Drive koppelen aan een Colab-instantie, gegevens op afstand ophalen en GitHub repo’s naar Colab klonen.
Automatisch versiebeheer
Net als Google Sheets en Docs heeft Google Colab ook een uitgebreide geschiedenis tracker. De module houdt alle wijzigingen bij die sinds het aanmaken van het bestand zijn gemaakt. U kunt de logboeken openen via het menu Bestand en op de optie Revisiegeschiedenis klikken.
Waarom zou u voor Google Colab moeten kiezen?

- Google Colaboratory is een cloud-gebaseerde tool. U kunt beginnen met het coderen van fantastische ML- en data science-modellen met behulp van een Chrome-browser.
- Colab is gratis met beperkte middelen. U moet echter niet verwachten dat u uw modellen voor kunstmatige intelligentie of machine learning onbeperkt kunt opslaan op de gratis infrastructuur van Colab.
- Als u met Jupyter kunt werken, hoeft u geen leercurve te doorlopen op Google Colaboratory.
- Gratis toegang tot GPU’s en TPU’s voor uitgebreide modellen voor data science en machine learning.
- Het wordt geleverd met vooraf geïnstalleerde en populaire data science-bibliotheken.
- Coders kunnen de code notebook gemakkelijk delen met collega’s om in realtime te coderen.
- Aangezien Google het notitieboek op Google Cloud host, hoeft u zich geen zorgen te maken over versiebeheer en opslag van codedocumenten.
- Kan gemakkelijk worden geïntegreerd met GitHub.
- U kunt AI trainen met behulp van afbeeldingen.
- U kunt ook modellen trainen op audio en tekst.
- Onderzoekers kunnen ook TensorFlow-programma’s op Colab uitvoeren.
Hoe Google Colab gebruiken

U kunt Google Colaboratory gebruiken als u aan de volgende minimumvereisten voldoet:
- Een Google-account om al het gemak van Colab te ervaren.
- Een computer waarop de nieuwste browser Google Chrome of Mozilla Firefox kan draaien
- Google raadt Chrome aan voor Colab.
- De voorwaarden voor het gebruik van Google-gegevens accepteren.
U hebt toegang tot Google Colaboratory via de officiële website. Colab is gratis; beperkte toewijzing van bronnen is echter niet altijd gegarandeerd. Als u meer snelheid en verwerkingsmogelijkheden met gegarandeerde bronnen nodig hebt, kunt u Colab Pro of Pro aanschaffen.

Voor enkele modellen voor data science en machine learning die geschikt zijn voor Colab, kunt u kijken op Google Seedbank.
De verschillen tussen Google Colab en Jupyter Notebook
Code Doc-functies | Google Colaboratorium | Jupyter notitieboek |
Direct codebestanden bekijken | Ja | Geen |
Delen van codedocumenten | Ja | Nee |
Geïnstalleerde bibliotheken | Ja | Nee |
Cloud hosting | Ja | Nee |
Bestanden synchroniseren | Ja | Nee |
#1. Colab heeft geen software-installaties op de lokale machine nodig. Jupyter Notebook daarentegen vereist software-installaties en lokale machineresources voor berekeningen.
#2. Aangezien Colab cloudgebaseerd is, krijgt u automatisch versiebeheer. Ook slaat Google Drive het Python-notitieboek automatisch op. Bij Jupyter Notebook daarentegen moet u het notitieblok regelmatig opslaan en versiebeheer uitvoeren.
#3. Colab-bestanden zijn beschikbaar op Google Drive voor back-updoeleinden. Van Jupyter Notebook-bestanden wordt daarentegen niet automatisch een back-up gemaakt.
#4. U kunt uw Colab-bestanden naar iedereen sturen, zelfs naar een klant die geen datawetenschapper is. Zij kunnen het document eenvoudig openen op Google Colab en de inhoud bekijken. De ontvanger hoeft geen software te installeren.
Integendeel, de ontvanger moet Jupyter Notebook installeren en uitvoeren om uw project te kunnen lezen. Daarom wordt het een uitdaging om dit bestand te delen met klanten die geen gegevenswetenschap bedrijven.

#5. Google Colaboratory wordt geleverd met de vereiste bibliotheken voor data science en machine learning projecten. Het geeft u ook een bepaalde hoeveelheid CPU, RAM, GPU en TPU in de cloud. U bespaart dus tijd en geld.
Als u daarentegen met de Jupyter Notebook-app werkt, moet u alle bibliotheken die voor uw project nodig zijn, downloaden en installeren. Het installeren van zoveel bibliotheken verbruikt ook de CPU-, RAM- en GPU-bronnen van de lokale machine.
Veelvoorkomende taken uitvoeren op Google Colab
Een notitieboek maken

- Ga naar de Google Colab-portal en zie “Welkom bij Colab!”
- Klik in het bovenste menu op Bestand.
- Kies in het contextmenu Bestand de optie Nieuw notitieboek.
- Uw nieuwe Python-notitieblok is klaar. U kunt het notitieboekbestand een andere naam geven.
Bestanden uploaden en downloaden
U kunt lokale Python-codes uploaden naar Colab door de volgende stappen te volgen:

- Klik in het bovenste menu op Bestand.
- Er wordt een contextmenu geopend met veel opties.
- Zoek naar Upload notebook en klik erop.
- U ziet nu een overlappende console met opties als Examples, Google Drive, GitHub en Upload.
- Klik op een tabblad en selecteer de code-inhoud die u wilt uploaden.
Het downloaden van uw lopende of voltooide project is ook supergemakkelijk. Dit zijn de stappen:

- Klik op het menu Bestand in de bovenste menubalk.
- Beweeg de cursor over Downloaden.
- Er wordt een contextmenu geopend met twee opties voor het downloaden van bestandsformaten: .ipynb en .py.
- U kunt het gewenste formaat kiezen en het bestand downloaden.
Toegang tot GitHub
Toegang tot GitHub is een fluitje van een cent in Colab. Dit is wat u kunt doen:

- Klik op Bestand in de bovenste menubalk.
- Selecteer Upload notebook in het contextmenu.
- Een console met een GitHub tabblad zal openen.
- U kunt ook op Ctrl O drukken om dezelfde console te openen.
- GitHub zoekopties zijn GitHub URL, gebruikersnaam, en organisatienaam.
Lokale bestanden openen
- Druk op Ctrl O op uw nieuwe Colab-notitieblok.
- Selecteer de Upload tab op de console die verschijnt.
- Klik op Bestand kiezen om het lokale bestand te zoeken dat u op Colab wilt openen.
Toegang tot Google Drive

- Klik op Bestand in het bovenste menu.
- U kunt Notebook openen of Notebook uploaden selecteren.
- Er verschijnt een console met een tabblad voor Google Drive.
- Klik daarop om bestanden van Google Drive te openen.
Als u Google Drive aan uw Colab-instantie wilt koppelen, volg dan deze stappen:

- Klik op Bestand in het linker navigatiedeelvenster.
- Selecteer de opdracht Mount Drive.
- In de melding die verschijnt, selecteert u Verbinden met Google Drive.
- Google zal u vragen om een account te kiezen voor autorisatie.
Opslaan in en importeren uit Google Sheets
U kunt uw notitieboekgegevens moeiteloos opslaan in een Google Sheets-bestand voor verdere verwerking. Voer daarvoor de volgende stappen uit:

- Klik op de knop Code Snippets in de linkerbenedenhoek.
- Aan de rechterkant wordt een navigatievenster geopend.
- Typ Sheets in het filter, en u vindt Codeknipsels Gegevens opslaan en Gegevens importeren.
- Dubbelklik op de titel om de code in het notitieblok op te nemen.
Toegang tot AWS S3
U hebt toegang tot bestanden en codeeractiva van cloudopslagplatforms zoals AWS S3 en Azure Blob door cloudopslagemmers te gebruiken.

Hiervoor moet u ByteHub installeren, dat de functionaliteiten heeft voor het laden en opslaan van gegevens op cloudopslag. U kunt de volgende code uitvoeren:
pip install -q bytehub[aws]
Toegang krijgen tot Kaggle-datasets

- Ga naar het Kaggle account en klik op Expire API Token in de API sectie om oude tokens te verwijderen.
- Maak een nieuw API-token aan om de kaggle.json op de lokale computer te krijgen.
- Gebruik nu de volgende code om Kaggle te installeren:
pip install -q kaggle
- Upload nu het Kaggle.json bestand naar de Python code base volgens een standaard coderingspraktijk.
Laatste woorden
Nu u de Google Collaboratory app grondig hebt besproken, zou u in staat moeten zijn om een vliegende start te maken met het leren, trainen of oefenen van machine-leerprojecten. Google Colab is een echt handige cloud-app voor wie van Jupyter Notebooks houdt.
Misschien bent u ook geïnteresseerd in enkele populaire open datasets voor data science projecten.