Les données sont la nouvelle huile. Et l'apprentissage automatique est le feu. Celui qui contrôle ces deux contrôlera le monde.
Non, ce qui précède n'est pas une phrase pompeuse tirée d'un roman dystopique.
C'est une réalité.
Le nouvel ordre mondial consiste à collecter de grandes quantités de données pertinentes et à les traiter en informations exploitables - ce que la race humaine n'a pas été capable de faire dans l'histoire. C'est le genre de technologie qui permet à un pays de devancer les autres et, finalement, de diriger le monde.
En conséquence, cela est pris très, très au sérieux par les nations progressistes du monde.
Un choix de carrière lucratif
Outre l'intrigue internationale, la science des données et machine learning est un nouveau domaine brûlant avec une opportunité incroyable. La demande est hors norme (pour le dire légèrement), et il n'y a pas assez de data scientists autour. Pas même les médiocres.
C'est comme si nous avions soudainement découvert de nombreuses nouvelles planètes habitables, et qu'il n'y avait pas assez de monde pour les déplacer. Je pourrais continuer encore et encore et ressembler à un disque rayé, mais je pense que cette infographie fait beaucoup mieux le travail:

Nous voyons donc que les salaires commencent à 50,000 250,000 $ et plus, et pour les gestionnaires, peuvent dépasser XNUMX XNUMX $.
Et pas seulement cela, la personne moyenne sur cette planète générera 1.7 Mo de données par seconde. Cela représente plus de 3,500 To de données sur toute la durée de vie - plus de données que nous ne savons comment en gérer pour le moment, sans parler de l'utilisation pour l'analyse. Dire que l'avenir est radieux ne rendrait pas service à ce magnifique nouveau pâturage.
La science des données et l'apprentissage automatique sont-ils difficiles?
Bonne question!
D'après mon expérience, la réponse est à la fois «oui» et «non».
intelligence artificielle (et par extension, l'apprentissage automatique), est la chose la plus difficile à faire si vous êtes enclin à vous lancer dans la recherche et à repousser les limites. Pour un tel travail, même un doctorat. en informatique et en mathématiques ne suffit pas. Mais alors, la personne moyenne n'a ni l'ambition, ni le temps pour une telle poursuite.
À l'autre extrémité, il y a ce que j'appellerais la science des données appliquées et l'apprentissage automatique.
Autrement dit, vous utilisez les outils, techniques et algorithmes existants et vous inscrire pour résoudre certains problèmes du monde réel. Cette partie nécessite du dévouement, de la perception et une pensée créative (et la connaissance de certains concepts mathématiques simples, qui sont rapidement appris), mais en ce qui concerne les vraies connaissances «techniques», elle est beaucoup plus indulgente que ce que le travail d'un ingénieur logiciel appelle.
En d'autres termes, ce n'est pas une promenade, mais passer par le rapport récompense / effort, est l'un des meilleurs investissements sur le marché.
Maintenant que vous avez durci votre volonté de devenir un data scientist et un ingénieur en apprentissage automatique, commençons à explorer les meilleures options.
Machine Learning (Google)
Peu de gens le savent, mais Google dispose d'un vaste, très pratique et cours gratuit sur l'apprentissage automatique. Selon la société, cela fait partie de leur engagement à faire progresser les technologies d'IA / ML et à garder les connaissances à découvert.

La meilleure chose à propos de ce cours est qu'il n'y a pas de prérequis, mais préparez-vous pour passer plus de temps à explorer les concepts de statistiques par vous-même.
Je veux dire, ce n'est pas nécessaire, mais si vous n'avez aucune expérience en statistiques avancées, les explications de ce cours peuvent ne pas suffire. Un autre hic est que ce cours présente l'apprentissage automatique via TensorFlow, qui est une implémentation ML développée par Google. Donc, d'une certaine manière, Google vise à promouvoir ses API pour l'apprentissage automatique, mais compte tenu de la valeur offerte par ce cours, je ne vois pas en quoi cela devrait être une pierre d'achoppement.
Si quoi que ce soit, TensorFlow est l'un des moyens faciles d'entrer dans le ML et jouit d'une popularité folle (pour une comparaison des frameworks d'IA, voir à cette ).
Data Science
Le nom du blog Harvard inspire la crainte, tout comme ce cours.
Commençons par le commencement: ce n'est pas un cours rapide où vous vous aventurez sur la pointe des pieds autour du Machine Learning en écrivant un extrait ici ou un script ici. Ce cours est un baptême du feu sévère qui demande un travail acharné et un investissement important en temps.

Le cours est livré avec des vidéos gratuites, du code (hébergé sur GitHub) et des solutions pour les exercices de laboratoire, donc pratiquement, vous n'êtes limité par rien si vous voulez le faire.
Public idéal?
Vous… je ne plaisante pas.
Je dirais que les professionnels qui travaillent avec une éducation en mathématiques décente, même s'ils ne sont peut-être plus en mathématiques (les habitudes d'inférence et de preuve sont la chose la plus nécessaire). Mais encore une fois, soyez prévenu: vous pourriez penser que vous êtes bon, mais ce cours vous donnera l'impression d'avoir des ongles durcis pour le petit-déjeuner - les problèmes de pratique sont suffisamment difficiles pour vous faire pleurer, mais alors, c'est peut-être exactement ce que vous avez. vous cherchez!
Machine Learning
Entrez dans un bar rempli de data scientists et demandez qui Andrew Ng est, et vous aurez une raclée de votre vie.
Dans les cercles de la science des données et de l'apprentissage automatique, Andrew Ng a atteint un statut divin, grâce à son cours exceptionnel sur Coursera — Machine Learning.
Et si vous doutez des informations d'identification d'Andrew Ng, je vais laisser cela parler de lui-même:

C'est un cours payant, en ce sens qu'il fait partie du plan tarifaire de Coursera, mais l'engagement financier et la détermination ne sont pas les seuls prérequis. C'est un long cours alors qu'Andrew plonge profondément dans les mathématiques derrière tout ce qui concerne le ML et dissèque les algorithmes populaires. Mais heureusement, c'est un cours complet, et vous serez guidé étape par étape dans les profondeurs les plus sombres et ramené.
J'ai fortement recommandé, principalement parce que l'affichage du certificat de réussite de ce cours est devenu une chose aujourd'hui!
Applied Data Science
Spécialisations sur Coursera consistent en une série de cours qui visent à vous faire passer de zéro à maîtriser un concept particulier. Si vous recherchez un cours complet, sérieux mais convivial sur la science des données et l'apprentissage automatique avec Python, je ne peux pas le recommander spécialisation suffisamment.

À la fin du cours, vous gagnez un certificat.
DataCamp
DataCamp propose de nombreux cours de science des données, qui incluent également plusieurs compétences et pistes de carrière. De la manipulation de données à l'apprentissage automatique, vous acquerrez des compétences de data scientist pour construire votre carrière dans Python et R qui vous aidera à réussir dans le domaine de la science des données.

Avec le contenu en octets de DataCamp, vous pouvez apprendre à votre rythme. Ces cours vous offrent une expérience pratique grâce à laquelle vous développerez vos compétences en science des données.

Vous pouvez commencer avec la version gratuite et évaluer le cours en regardant le premier chapitre.
edX
Apprenez de MITx, Harvardx, IBM, RICEx, UCSanDiegox et GTx sur le plateforme edX.
Tous ont un programme complet qui vous aide à posséder des compétences en data scientist. Ces programmes sont les mieux adaptés à ceux qui ont une formation en statistique ou en informatique.

Si vous ne cherchez pas de programme, vous pouvez choisir un programme à la carte. Au EDX, vous trouverez plus de 200 cours liés à la science des données, qui couvrent Python, R, Excel, probabilités, statistiques, apprentissage automatique, visualisation de données, Et beaucoup plus.
Codecademy
Codecademy est une autre plate-forme qui est l'un des meilleurs systèmes qui vous aide à apprendre à coder. Ils croient en «Apprendre en faisant» et ont de nombreux projets et tests pratiques sur leur plateforme.
La solution cours de science des données proposé par Codecademy comprend SQL, Python 3, NumPy, Pandas, Matplotlib, Scikit-learn et bien d'autres bibliothèques.

L'ensemble du cheminement de carrière contient 26 cours qui sont plus que suffisants pour vous aider à devenir un data scientist à succès.
Ce cours de données:
- Vous donne une connaissance approfondie de la science des données
- Fournit une feuille de route facile à suivre
- Vous rend prêt pour l'emploi en vous aidant à acquérir suffisamment d'expérience pratique
Udemy
Udemy n'a besoin d'aucune présentation.
Bootcamp Python pour Data Science et Machine Learning sur Udemy est l'un des cours les plus populaires avec une note de plus de 85K + de 4.6 et a été suivi par plus de 370K étudiants à travers le monde.

Voici les sujets traités dans ce cours:

Voici les caractéristiques / livrables de ce cours:
- 25 heures de vidéos à la demande
- Accès à vie complet
- 13 articles et cinq ressources téléchargeables
- Accès sur mobile et TV
- Certificat d'achèvement
- Garantie de remboursement 30-Day
Donc, si vous préférez un cours à petit budget, ce serait le mieux adapté pour vous de commencer.
Google AI
Seriez-vous intéressé par l'apprentissage automatique des experts en ML chez Google?
Eh bien, vous devez vérifier les cours sur Google AI.
Cette plate-forme propose des cours et du contenu d'apprentissage automatique et de science des données pour les étudiants, les ingénieurs en logiciel, les scientifiques des données et même les chercheurs. Ces cours sont gratuits.
Commencer avec, Cours intensif d'apprentissage automatique chez Google AI devrait être votre cours de prédilection. Il s'agit d'un cours rapide avec une introduction pratique à l'utilisation des API TensorFlow. Voici les détails de ce cours:

Cette plateforme propose également des cours spécifiques sur des sujets importants de l'apprentissage automatique tels que regroupement, systèmes de recommandation, test et débogage dans l'apprentissage automatique, séparation des données et ingénierie des fonctionnalités dans l'apprentissage automatique. Si vous connaissez déjà les bases de l'apprentissage automatique, ces cours seront d'une valeur ajoutée.
Udacity
Udacity est également une plate-forme d'apprentissage en ligne très populaire qui propose une pléthore de cours sur les technologies de pointe. Il dispose de plusieurs programmes de pointe conçus et reconnus par les plus grandes entreprises du monde entier, telles que AT&T, AWS, Google, IBM.
L'un des programmes d'Udacity est pour la science des données - École de science des données. Ce programme vous aide à décrocher des emplois d'analyste de données, de scientifique de données, d'ingénieur de données et d'analyste commercial. Un cours sur Data Scientist dans ce programme est le cours crucial qui couvre les concepts d'apprentissage automatique, d'apprentissage en profondeur et de génie logiciel. Vous devez avoir des connaissances de base en apprentissage automatique pour opter pour ce cours.

Si vous connaissez la programmation python mais que vous êtes nouveau dans l'apprentissage automatique, il existe un autre programme sur Udacity - École d'IA. Ce programme propose des cours partant des bases de l'apprentissage automatique.

Deep Learning
Ce cours est une bénédiction et c'est ma recommandation préférée sur cette liste si vous êtes un codeur.
Je le répète: si vous êtes un codeur.
C'est parce que ce cours ne passe pas de temps à vous enseigner les bases de la programmation. La description du cours le dit en termes très clairs (l'emphase est originale):
Nous supposons que tous ceux qui suivent ce cours ont au moins un an d'expérience en codage. Le cours utilise python comme langage d'enseignement, donc si vous ne connaissez pas déjà python, nous supposons que vous passerez le temps à apprendre - pour un codeur expérimenté, vous devriez trouver que python est un langage assez facile à apprendre.

Donc si vous connaissez déjà Python (sinon apprendre ici), ou peuvent se mettre à l'aise rapidement, c'est le cours parfait pour les pragmatiques qui veulent construire des systèmes réels et utilisables sans trop se soucier des fondements théoriques des algorithmes.
Je pourrais même dire que c'est pour les bricoleurs impatients (comme moi!) Qui détestent la cérémonie et la monotonie.
Et oh, ai-je mentionné que c'est 100% gratuit et qu'il y a une grande communauté?!
Conclusion
Ouf!
C'était une liste difficile à compiler. Non pas parce qu'il n'y avait pas assez de bonnes sources, mais parce qu'il y en avait beaucoup trop!
L'apprentissage automatique est un domaine qui a littéralement explosé et qui résout des problèmes difficiles de manière très élégante, et il y a donc des centaines de cours en ligne, gratuits et payants, la plupart étant vraiment, vraiment bons. Mais cela peut aussi être source de confusion, c'est pourquoi j'ai essayé de le ramener à onze pour différents types d'apprenants en fonction de leur niveau d'expérience.
J'espère que ça a aidé!