Une API d’IA permet aux entreprises d’intégrer des fonctions intelligentes dans leurs applications à l’aide d’interfaces de programmation d’applications simples.
Depuis 2010, nous sommes entrés dans l’ère de l’intelligence artificielle (IA), où des technologies telles que la reconnaissance faciale et la reconnaissance vocale offrent des expériences client supérieures et des avantages concurrentiels. Les entreprises n’ont pas besoin d’embaucher une équipe de docteurs ; de nombreux acteurs majeurs et de niche offrent des services d’IA matures par le biais d’API REST. Ces API, souvent disponibles pour un coût minime ou même gratuitement, permettent aux entreprises d’intégrer facilement des fonctionnalités d’IA et d’améliorer leurs opérations commerciales.
Pour quelques dollars au total, et dans certains cas gratuitement, vous pouvez évaluer ces services et voir s’ils constituent une proposition de valeur solide pour le cycle de vie de votre entreprise. Examinons maintenant les principales plateformes d’API d’IA en fonction de leur technologie innovante, de l’accessibilité et de la facilité d’utilisation des API, et de leur pertinence dans les différents secteurs d’activité.
Lorsqu’il est question d’IA, Google est le premier nom qui vient naturellement à l’esprit.
Et le deuxième nom ?
En tout cas, je n’en vois aucun ! 😂 Google domine le partage des idées lorsqu’il s’agit de conversations sur l’IA, et pour une bonne raison. Au fil des ans, l’entreprise a déversé peut-être des milliards de dollars dans la recherche et les talents en matière d’IA. Plusieurs de ses ambitieux projets d’IA sont bien connus, et un coup d’œil sur ses derniers travaux fait froid dans le dos :
Grâce à cette expertise approfondie, Google dispose d’API parmi les plus performantes en matière d’IA/ML. Examinons quelques-unes de leurs principales offres.
Analyse de texte (traitement du langage naturel)
L’un des plus grands progrès de l’IA a été de comprendre et de travailler avec les langues naturelles, qu’elles soient écrites ou parlées. L’API d’analyse de texte de Google est incroyablement puissante et offre des fonctionnalités telles que
- L’analyse syntaxique (analyse d’un texte donné et identification des éléments clés)
- L’analyse d’entités (recherche de factures dans des documents non structurés, par exemple)
- Analyse des sentiments (identifier l’humeur, l’intention, etc., à partir d’un texte écrit ou parlé)
- Multilingue (fonctionne avec de nombreuses langues)
Si vous avez envie de connaître le sentiment de vos clients à partir de leurs discussions d’assistance, essayez-le tout de suite !
Prédiction
Google propose un service de prédiction dédié si vous disposez de vos propres modèles et que vous souhaitez générer des prédictions sur de nouvelles données. Il est même possible d’ajouter du code personnalisé si vous souhaitez quelque chose de non standard ou d’expérimental. Le service de prédiction fait partie d’une offre complète appelée AI Platform, dont nous parlerons plus loin.
Plateforme d’IA
Ceux qui travaillent avec des données et l’IA savent à quel point chaque étape du processus peut être fastidieuse et prendre du temps. Pour résoudre ces problèmes, Google propose une plateforme complète de bout en bout appelée Plateforme IA. Il s’agit d’un service entièrement géré pour la science des données et l’intelligence artificielle, qui vise à rendre l’aspect opérationnel de l’intelligence artificielle et de la manipulation des données aussi simple que possible.
Ainsi, si vous disposez d’une installation de ML non triviale et que vous en avez assez des contretemps et des attentes, la plateforme d’IA de Google pourrait valoir le coup d’œil.
Ce serait trop demander que de décrire tous les services d’IA/ML de Google, aussi les personnes intéressées peuvent-elles se rendre sur les documents officiels. Vous y trouverez bien d’autres choses sérieuses, inexplorées et stupéfiantes !
OpenAI
Si vous vous intéressez ne serait-ce qu’un peu à l’espace de l’IA, vous aurez remarqué l’émergence de GPT-4. Il s’agit d’un modèle avancé de ML pour travailler avec les langues naturelles, qui a fait craindre à tout le monde que l’apocalypse était enfin arrivée. La force derrière GPT-4 est OpenAI, une organisation créée pour encourager la recherche et la collaboration dans l’espace de l’IA – tout en étant ouvert, ce qui est une rareté dans le monde d’aujourd’hui.
L’entreprise a été popularisée par Elon Musk, l’un de ses fondateurs, lorsqu’elle a reçu une attention médiatique massive pour ses recherches en matière d’IA. Un exemple en est l’IA qui a joué avec des joueurs professionnels de DOTA 2 et les a détruits au plus haut niveau :
À l’heure où nous écrivons ces lignes, Elon Musk n’est plus impliqué, et OpenAI n’est pas exactement “ouverte”, conformément à ses principes fondateurs. Mais il s’agit là d’une autre discussion, et vous pouvez trouver beaucoup d’informations à ce sujet.
Pour nous, l’essentiel est qu’OpenAI réalise des travaux révolutionnaires dans le domaine de l’IA, en particulier en ce qui concerne le traitement de texte, letraitement des images et des vidéos, etc. Elle propose plusieurs services d’IA sous forme d’API, et je suis sûr qu’il est facile de trouver un cas d’utilisation solide pour chacun d’entre eux :
- Recherche sémantique : Permet d’effectuer des recherches dans des données textuelles libres, telles que des documents, sur la base d’une requête formulée en langage naturel. Ainsi, si vous disposez d’une bibliothèque numérisée de tous les chats de l’assistance à la clientèle, vous pouvez demander des choses comme “montrez-moi une liste de chats où les clients étaient très en colère à cause d’une résolution tardive”. Il ne s’agit pas d’un exemple officiel, mais je tenais à préciser les possibilités qui s’offrent à vous ! 😁
- Chatbots : La plupart des chatbots aujourd’hui ne sont rien d’autre que d’énormes paniers remplis de regrets. L’entreprise qui a décidé de les déployer regrette plus tard, le développeur qui a créé le bot regrette cette création inutile, le client qui navigue sur le site regrette d’avoir interagi avec le bot . . vous voyez l’idée. En revanche, les capacités de chat d’OpenAI sont bien supérieures, en particulier lorsqu’il s’agit de bavardage, de tournures inattendues de la conversation, d’intentions indirectes, etc. Bien sûr, ce n’est pas parfait, mais la barre est suffisamment haute pour que les chatbots passent d’odieux/imbéciles à amusants.
- Service client : Si vous craigniez de devoir combiner les deux services précédents pour créer une expérience de service client viable, OpenAI l’a déjà fait. Il existe un service dédié au service client qui possède des capacités de recherche, de recommandation, etc.
- Génération de texte : À l’instar de la technologie GPT-3 dont nous avons parlé il y a quelques temps, OpenAI offre des capacités de génération de texte via l’API. Le résultat est un texte réel et intelligent sur à peu près n’importe quoi (même des choses abstraites et bizarres) que vous pouvez utiliser de diverses manières créatives !
- Compréhension : Ce service prend un texte donné et en produit un résumé. Oui, avec ses propres mots ! Le gain de temps et le champ d’application d’un tel service sont immenses. La lassitude des courriels est à mon avis un bon cas d’utilisation : il suffit de demander à l’IA de résumer les messages pour que vous puissiez vider votre boîte de réception en 10 minutes au lieu de trois heures !
- Autres outils : OpenAI dispose également de quelques autres outils/services qui s’avèrent utiles dans le cadre d’une utilisation réelle. Par exemple, il est possible de convertir les résultats d’une recherche sémantique en une feuille de calcul pour faciliter l’analyse ; il existe également un service permettant de traduire un texte d’une langue à l’autre (un besoin assez courant) ; et ainsi de suite.
Si OpenAI a récemment fait sensation dans le monde de l’IA, l’accès à ses API n’est pas facile. Vous devez faire une demande pour rejoindre une liste d’attente ; qui est approuvé, quand et comment – tout cela reste également un mystère. Enfin, n’oubliez pas que si ces technologies sont extrêmement puissantes, elles ne sont pas encore tout à fait au point. D’où l’étiquette “bêta” apposée sur l’ensemble de leurs services. Néanmoins, je dirais que cela vaut la peine de faire une demande et de l’essayer dans le cadre d’un projet pilote.
Microsoft Azure
En ce qui concerne les offres de cloud computing, Microsoft est considéré comme un lointain troisième (après AWS et Google). Mais cela ne signifie pas que l’entreprise est en difficulté ; elle a sa propre stratégie (migration des entreprises Windows existantes) et fait sa propre course. Si le nom Azure est bien connu, ce qui ne l’est pas, c’est qu’Azure dispose également d’un ensemble robuste d’offres en matière de services liés à l’IA. Dites bonjour à Azure Cognitive Services !
AzureCognitive Services est une offre d’IA à part entière qui comprend à peu près tout ce dont vous avez besoin pour créer des applications intelligentes et puissantes. En fait, la plupart de leurs API ont des cas d’utilisation intéressants et plus spécialisés, ce qui, à mon avis, leur donne un avantage. Voici un résumé rapide des principales API dont ils disposent et de leurs capacités :
- Langage : Ces API sont construites autour de ce que l’on appelle le traitement du langage naturel en informatique. En termes plus simples, il s’agit d’extraire le sens des langues humaines (parlées ou écrites), de les générer et de travailler avec elles. Parmi les fonctionnalités intéressantes, citons le créateur de QnA conversationnel (imaginez les possibilités en matière de formation, d’éducation et d’embauche !), l’intégration de l’intelligence conversationnelle dans les appareils IoT et autres, l’analyse des sentiments et d’autres métadonnées sur un texte donné, la traduction (60 langues à l’heure actuelle), et bien plus encore.
- Parole : Ces API permettent aux applications de travailler avec la parole humaine. Les principales offres comprennent la conversion de la parole en texte, la conversion du texte en parole, la traduction de la parole et la reconnaissance de la parole.
- Vision : La vision par ordinateur est un sujet d’actualité et, bien qu’elle soit loin d’être parfaite, elle est suffisamment performante dans les scénarios où il existe une certaine marge d’erreur. Les API de vision proposées comprennent des fonctionnalités telles que l’analyse d’images et de vidéos, la reconnaissance d’objets (dans les images et les vidéos), la détection de visages, l’indexation de vidéos (génération de métadonnées à partir de vidéos), etc.
- Décision : Il s’agit d’un ensemble d’API à usage général qui permettent de prendre de meilleures décisions ou d’améliorer le processus que vous suivez pour prendre des décisions basées sur la ML. Les capacités offertes dans cette gamme sont la détection d’anomalies (extrêmement utile pour les scientifiques des données), la modération de contenu, le service de personnalisation (qui vous aide à créer des interactions intelligentes et personnalisées pour les utilisateurs de vos applications), et bien d’autres choses encore.
Le Microsoft d’aujourd’hui est très différent, avec une vision claire et une focalisation sur le nuage, les services et les solutions intégrées. Si vous travaillez sous Windows, que ce soit sur site ou dans le nuage, l’intégration des API cognitives Azure dans vos produits est d’autant plus logique.
API AI/ML
AI/ML API est une plateforme qui permet d’accéder à 100 modèles d’IA (par exemple Mixtral, LLaMA, Qwen, Stable Diffusion, Realistic Vision, Falcon, etc.) pour diverses applications, telles que l’analyse prédictive, le traitement du langage naturel, la reconnaissance d’images, la vision par ordinateur, etc.
L’API AI/ML est une solution idéale pour les entreprises, les startups et les laboratoires d’innovation qui cherchent à intégrer des technologies d’IA de pointe pour construire des prototypes simples ou des systèmes d’IA complexes. En outre, il est possible de personnaliser entièrement ces modèles d’IA prêts à être déployés en fonction des besoins spécifiques du projet, afin d’obtenir des performances et une pertinence optimales.
Les développeurs peuvent s’appuyer sur l’API AI/ML pour toute une série de tâches, telles que la création de chatbots d’IA générative, la formulation de recommandations de contenu personnelles, la traduction linguistique, l’analyse des sentiments, la classification d’images et la détection d’objets. Toutes ces tâches sont facilitées par la documentation complète et les outils de développement de l’API AI/ML. De plus, ses connexions API robustes garantissent une intégration en douceur avec les piles technologiques existantes, notamment Zapier, Bubble, ProtoPie et Retool.
AI/ML API se targue d’une infrastructure sans serveur pour aider les développeurs à réduire les coûts de déploiement et de maintenance. L’un des principaux avantages de l’utilisation de l’API AI/ML est la flexibilité qu’elle offre aux entreprises pour utiliser leur plateforme conformément aux lois locales et à l’éthique professionnelle, sans imposer d’interdictions générales.
Un autre avantage de l’API AI/ML est son tableau de bord utilisateur, qui permet aux utilisateurs de surveiller facilement l’utilisation et l’accès à l’API à partir de n’importe quel appareil. De plus, le temps de disponibilité de 99 % garantit un fonctionnement sans faille avec un minimum d’interruptions. Cette API est compatible avec la structure de l’API OpenAI, ce qui signifie que les développeurs n’ont pas à apporter de modifications majeures à la base de code existante. Au lieu de cela, il suffit de modifier les points d’extrémité et d’entrer la clé API pour économiser énormément d’argent pour une qualité de sortie similaire.
Avantages de l’API AI/ML
- Prise en charge multiplateforme.
- Accès à 100 modèles d’IA avec une seule API.
- Transition facile pour les utilisateurs existants de l’API OpenAI.
- Évolutivité permettant de prendre en charge des organisations de toute taille.
Inconvénients de l’API AI/ML
- Le temps de disponibilité est un peu faible pour les projets critiques
- L’adaptation de certains modèles à des cas d’utilisation très spécifiques peut nécessiter un travail supplémentaire.
Prix de l’API AI/ML
- Niveau gratuit : Offre un accès de base aux fonctionnalités de l’API AI/ML avec une semaine d’essai gratuit.
- Plans d’abonnement : Options d’abonnement personnalisées pour une mise en œuvre avancée, des limites d’utilisation plus élevées et des solutions d’entreprise.
Services AWS AI
Lorsque l’on parle de services et d’infrastructures basés sur le cloud, il est impossible de ne pas mentionner Amazon Web Services (AWS). Je n’ai pas trouvé de source très crédible, donc je ne peux pas la citer, mais apparemment, AWS détient à lui seul environ 33 % de la part de marché de l’informatique en nuage. En tant que développeur, je peux témoigner de la force d’attraction de la plateforme pour toutes sortes et tailles d’architectes logiciels, de directeurs techniques, de développeurs, de chefs d’entreprise, etc.
S’il s’agit d’un nouveau produit SaaS, les gens veulent l’héberger sur AWS dès le départ ; et si quelqu’un a des problèmes de mise à l’échelle ou de stabilité, il veut le transférer sur AWS.
Je ne dis pas qu’AWS est le meilleur choix absolu pour l’infrastructure cloud, mais sa gamme de services et sa stratégie de prix bas sont difficiles à battre. Enfin, si vous souhaitez intégrer des capacités d’IA/ML à vos applications (nouvelles ou existantes), vous ne pouvez pas vous tromper en optant pour les services d’IA d’AWS.
Voici leur présentation :
AWS propose plusieurs services puissants et riches en fonctionnalités en matière d’IA/ML. Jetons un coup d’œil rapide à ces services :
- Polly : La synthèse vocale est une fonctionnalité très demandée de nos jours, notamment parce qu’elle permet aux entreprises de créer des applications intelligentes et réellement “vivantes”, capables de converser avec une voix humaine et crédible. C’est ce que fait Amazon Polly. Si le résultat n’est pas vraiment à la hauteur des espérances (écoutez les échantillons officiels ici et ici), il est tout à fait satisfaisant pour la plupart des cas d’utilisation.
Vous souhaitez essayer cette solution ? Découvrez comment convertir des articles en audio.
- Transcrire : Ce service est l’inverse de Polly : il transforme la parole en texte. Je peux personnellement témoigner de son efficacité, car j’ai utilisé Transcribe dans l’un des projets pour lire des enregistrements de centres d’appels et produire une transcription. Le résultat était extrêmement précis (encore une fois, je n’ai pas de statistiques, mais je dirais que la précision était supérieure à 95 %), et il était capable de capter sans effort différents accents, même avec un certain bruit de fond. De plus, la quantité de métadonnées générées était stupéfiante.
- Rekognition : Rekognition est le service d’Amazon pour la vision par ordinateur (pour les images et les vidéos). Outre les fonctions classiques telles que la reconnaissance faciale, la détection d’objets, l’étiquetage, etc., il offre également des possibilités intéressantes telles que la modération de contenu (pour contrôler ce que vos enfants regardent sur leurs appareils, par exemple), la reconnaissance de célébrités, la reconnaissance d’équipements (pour la sécurité et la conformité des travailleurs), et bien plus encore.
- Détecteur de fraude : La fraude est un véritable gouffre qui coûte chaque jour beaucoup d’argent et d’efforts aux entreprises. Ce service permet de détecter les fraudes lors de la création d’un nouveau compte, du passage en caisse des clients, des paiements en ligne, de l’utilisation abusive des programmes de fidélisation, etc. Il est clair que ce service serait très utile à l’écosystème du commerce électronique.
- Lex : Si vous aimez les chatbots, mais que vous en avez assez des chatbots ennuyeux et stupides que l’on trouve partout, Lex est l’outil qu’il vous faut. Il possède toutes les capacités dont un chatbot moderne a besoin, et comme il s’agit d’un service géré, vous n’avez pas à vous préoccuper de l’exploitation des serveurs.
- Kendra : Kendra est un service de recherche de documents, sauf que les requêtes sont formulées en langage humain. Le service est apparemment doté d’une “expertise” approfondie dans quelques secteurs, ce qui signifie que si vos données proviennent de l’un de ces secteurs, la recherche peut être affinée pour plus de précision.
AWS a répertorié quelques autres services, mais si j’essaie de tous les couvrir, je vais manquer de papier et d’encre ! 😁 D’ailleurs, si je sais une chose à propos d’AWS, c’est qu’elle suit la loi de Hubble, ce qui se traduit par un univers en perpétuelle expansion. Au moment où vous lirez cet article, leur nombre de services d’IA aura peut-être doublé, voire décuplé ! Par conséquent, si vous êtes intéressé, je vous encourage à visiter la page officielle et à passer du temps à explorer les services, les capacités, les coûts, etc.
Étant donné qu’AWS détient la plus grande part de marché, il y a de fortes chances que vous soyez déjà hébergé sur AWS. Ou peut-être envisagez-vous de transférer votre infrastructure sur AWS ? Si c’est le cas, choisir AWS AI Services permettra à vos applications de fonctionner avec d’autres services AWS (comme S3, EC2, SNS, etc.) de manière transparente et fiable. Il suffit de parler à des personnes qui ont dû maintenir des apps réparties sur plusieurs infrastructures pour être convaincu à vie. 😝
ParallelDots
ParallelDots est, il est vrai, loin d’être aussi populaire que les entreprises de cette liste. Cependant, ils sont une trouvaille rare et je pense qu’ils méritent plus de visibilité.
En tant qu’entreprise spécialisée dans l’IA, elle crée des outils très utiles et des solutions spécifiques à l’industrie. Dans leur menu de produits, il n’y a que quatre articles (du moins jusqu’à présent), et l’un d’entre eux s’est démarqué pour moi parce qu’il était générique et très précis. Et le service dont nous parlons est leur API d’analyse de texte.
Si vous vous rendez sur le lien ci-dessus et que vous descendez un peu, vous trouverez une sorte de terrain de jeu en direct, où vous pouvez saisir n’importe quel texte et voir les capacités d’analyse de l’IA en cliquant sur un bouton.
Le texte que vous voyez dans la capture d’écran est le texte par défaut défini par l’IA. Une fois que vous avez appuyé sur le bouton vert Analyser, l’analyse du texte selon différentes catégories apparaît ci-dessous (les catégories sont les boutons).
Alors, quelle est la qualité de l’API ? J’ai pensé à faire mes propres tests, et je lui ai donc donné quelque chose de moins simple : un morceau de prose tiré de l’un des classiques de la littérature moderne (pour les curieux, il s’agit de Sur la route de Jack Kerouac, écrit en 1957). Commençons par lire le texte nous-mêmes :
Les seules personnes pour moi sont les fous, ceux qui sont fous de vivre, fous de parler, fous d’être sauvés, désireux de tout en même temps, ceux qui ne bâillent jamais et ne disent jamais rien de banal, mais qui brûlent, brûlent, brûlent comme de fabuleuses chandelles romaines jaunes qui explosent comme des araignées à travers les étoiles.
Qu’en pensez-vous ? Qu’est-ce qu’elle essaie de transmettre ? Quel état d’esprit vous semble-t-il refléter ? Il serait bon de faire une pause et de réfléchir à ces questions.
J’ai ensuite collé le texte dans la zone de texte et j’ai cliqué sur Analyser. Voici ce que j’ai obtenu :
Dans l’ensemble, c’est plutôt bon ! Le morceau de prose que j’ai sélectionné est assez difficile et n’indique rien de manière explicite. Cependant, le lecteur averti détectera une nuance claire d’angoisse/de colère qui se démarque. Et c’est aussi ce que l’API montre comme l’émotion dominante ! Cependant, le texte n’est pas simplement en colère, ce qui se reflète dans le score de confiance de l’API de 30,58 %. Le score de près de 20 % attribué à l’”ennui” et au “bonheur” est également logique, car je pense que ces émotions se reflètent dans le texte, même si elles ne sont pas dominantes. La peur, la tristesse, l’excitation . qui suis-je pour dire qu’elles sont absentes du texte ? Le fait est que la composition et la compréhension de la prose sont hautement subjectives, donc si vous n’êtes pas d’accord avec moi, ce n’est pas grave 🙂
Cependant, personnellement, j’ai été tout aussi impressionné par le service ParallelDots que j’ai exploré d’autres parties de l’analyse ci-dessus. Bien sûr, ce n’était pas toujours la bonne cible, et dans quelques cas, c’était bizarre aussi ; mais comme je l’ai écrit plus tôt dans cet article, une précision de 100% n’est pas le but (et peut-être même pas réalisable). L’objectif est de disposer d’une IA puissante qui nous aide à créer le type d’applications dont nous n’avons pu que rêver pendant des décennies.
Alors, le service d’analyse de texte de ParallelDots est-il fait pour vous ?
Je dirais oui si vos besoins se limitent à l’analyse de texte, si vous souhaitez une précision extrêmement élevée et si vous n’aimez pas le manque d’attention dont vous bénéficiez en tant que client lorsque vous choisissez parmi les plus grands noms du secteur.
Watsonx
Il n’y a pas si longtemps, le projet Watson d’IBM était l’IA toute puissante qui remplacerait les humains une fois pour toutes. Elle créait des bandes-annonces de films, battait les meilleurs joueurs de Jeopardy, etc. La fin est proche ; tout le monde en était convaincu au plus profond de son cœur. En 2020, Watson n’est plus dans les mémoires.
Mais cela ne signifie pas qu’il s’agissait d’un projet éclair qui a été mis au rancart par la suite. Bien que l’IA n’ait pas atteint son potentiel épique (ou peut-être était-ce une stratégie de relations publiques depuis le début ?!), Watson continue de vivre en tant que cerveau des offres d’IA d’IBM pour les entreprises.
Voici les principaux services proposés dans le cadre des solutions Watson:
- Watson Assistant : ce service contient de nombreux éléments visant à améliorer l’expérience du service à la clientèle – tant pour le client que pour l’agent ! Aider les agents à trouver rapidement des informations pour résoudre les demandes, comprendre les demandes des clients et personnaliser leur parcours, fournir des données et des indicateurs détaillés, et extraire des informations de ces données – Watson Assistant fait tout cela.
- RegTech : IBM RegTech est un service lourd visant à améliorer la conformité et à intégrer la gestion des risques à tous les niveaux des opérations d’une organisation. À un niveau plus fin, il cible également des problèmes clés tels que la fraude aux paiements, la criminalité financière, etc.
- Watson Health : Watson Health est un service d’IA hautement spécialisé pour le secteur de la santé. Il répond notamment aux besoins en matière de données dans le domaine de la recherche, de l’imagerie diagnostique, de l’optimisation des plans de soins de santé en termes de coûts et de qualité, etc.
- AIOps : AI Ops = AIOps, dit IBM. Il s’agit d’un service d’IA spécialisé dans l’optimisation des opérations informatiques. La chaîne d’outils et les opérations informatiques peuvent devenir si vastes et complexes qu’aucune solution ne semble réalisable au niveau de l’entreprise. Dans ces scénarios, AIOps aide à la détection précoce des problèmes, à la résilience des solutions, à l’amélioration de la prise de décision, etc.
- Watson Media : Le service Watson Media est spécialisé dans la diffusion de vidéos en direct à grande échelle. La partie IA le rend capable de générer des légendes, de rechercher des vidéos, d’analyser des vidéos, etc. à la volée. Les flux des caméras de sécurité étant également une forme de diffusion en direct, Watson Media est également adapté à la détection des menaces, à la reconnaissance des objets, etc.
IBM propose encore d’autres services d’IA, que vous pouvez découvrir ici. IBM est un choix solide pour les services d’IA, mais n’oubliez pas que leur positionnement et leurs offres sont optimisés pour les grandes et très grandes entreprises, alors assurez-vous qu’il s’agit d’un choix mutuel.
API de Rev.ai
Rev.ai est une autre de ces entreprises d’IA qui croient au développement de l’expertise et au fait de bien faire certaines choses. Sauf qu’elle a décidé de ne faire qu’une seule chose bien. Oui, une seule ! La conversion de la parole en texte. Oui, c’est littéralement tout ce qu’ils offrent ! Il n’y a même pas de synthèse vocale, et encore moins d’autres catégories d’IA/ML.
Et le résultat de cette obsession, à la limite de la folie ? Une précision extrême, sans doute la meilleure parmi les meilleures au monde. L’entreprise apporte la preuve de son intelligence artificielle sur cette page.
Comme vous pouvez le voir, leurs tests montrent que Rev.ai est beaucoup plus précis que la synthèse vocale de Google. Il y a de nombreuses comparaisons similaires sur cette page (toutes comparées à Google et montrées contre lui), bien qu’il n’y ait malheureusement pas de terrain de jeu en direct (je me demande pourquoi ; est-ce que cela utilise beaucoup de puissance de calcul ? Une autre raison ?). Mais cela ne signifie pas que vous ne pouvez pas évaluer le service ; vous pouvez créer un compte gratuit et examiner l’API aussi attentivement que vous le souhaitez 🙂
Rev.ai pourrait lancer d’autres services à l’avenir, et je m’empresse de ” réparer ” cet article. Cependant, ce n’est pas le cas aujourd’hui, donc si vous voulez un service de synthèse vocale sans compromis sur la précision, Rev.ai mérite votre attention.
Wit.ai
Wit.ai est une plateforme d’IA dotée de capacités avancées en matière de traitement de la parole et de traitement du texte. Oui, cela ressemble à tous les autres services de NLP et d’analyse/transcription de texte existants, mais il y a plus :
- Wit.ai est open source. Rien ne vous empêche donc d’apprendre de leur technologie ou d’héberger la plateforme sur votre infrastructure.
- Wit.ai n’est pas qu’un simple dépôt de code sur GitHub : il s’agit d’un service d’API réel et opérationnel (sous la forme d’API HTTP), qui est ouvert à tous.
- Le service API est gratuit. Oui, totalement gratuit ! En fait, il est tellement gratuit qu’il n’existe aucun plan de tarification. 🤣🤣
- Wit.ai se veut extensible. C’est-à-dire que son objectif principal est plus ou moins de vous aider (vous pousser ?) dans la création, l’entraînement, le test et l’utilisation de modèles ML.
Le dernier point de la liste ci-dessus (à propos de l’extensibilité) a besoin d’être décomplexé, alors voici : Wit.ai est destiné à s’intercaler entre l’utilisateur et l’appareil qui prend les commandes et exécute les actions. L’utilisateur parle ou envoie un texte à Wit.ai, qui peut analyser le message et générer des métadonnées. Une fois qu’il a compris ce que l’utilisateur veut faire (cherchez “intent” dans la capture d’écran ci-dessus) et comment il veut le faire (les autres détails de la capture d’écran : tâche et date), il envoie des commandes et des informations pertinentes à l’appareil.
Je dois insister sur le fait que Wit.ai n’a que très peu de capacités. L’idée est de vous pousser à créer vos propres modèles de ML, un processus qui est généralement frustrant mais qui est rendu amusant et facile par Wit.ai. Et c’est là que réside sa force. Et si vous décidez d’utiliser l’API gratuite, n’oubliez pas qu’il existe des limites de taux (environ 100-250 requêtes par minute, selon le point de terminaison).
Conclusion
Intelligence artificielle (IA), apprentissage automatique (ML), réseaux neuronaux, données, modèles, formation, prédiction… . aucun de ces termes n’est plus à la mode. Et comme c’est le cas pour toute technologie révolutionnaire, une fois qu’elle s’est stabilisée, l’IA s’est banalisée. Les plateformes dont il est question dans cet article mettent les mêmes superpouvoirs à la disposition de tous, qu’il s’agisse d’une startup naissante ou d’un mastodonte de l’industrie.