Eine KI-API ermöglicht es Unternehmen, intelligente Funktionen über einfache Anwendungsprogrammierschnittstellen in Anwendungen zu integrieren.
Seit 2010 sind wir in die Ära der Künstlichen Intelligenz (KI) eingetreten, in der Technologien wie Gesichts- und Spracherkennung überlegene Kundenerlebnisse und Wettbewerbsvorteile bieten. Unternehmen müssen kein Team von Doktoranden einstellen; viele große und kleine Unternehmen bieten ausgereifte KI-Dienste über REST-APIs an. Diese APIs, die oft für minimale Kosten oder sogar kostenlos erhältlich sind, ermöglichen es Unternehmen, KI-Funktionen einfach einzubinden und ihre Geschäftsabläufe zu verbessern.
Für insgesamt nur wenige Dollar, in einigen Fällen sogar kostenlos, können Sie diese Dienste testen und herausfinden, ob sie einen soliden Mehrwert für Ihre Geschäftsabläufe bieten. Werfen wir nun einen Blick auf die besten KI-API-Plattformen auf der Grundlage ihrer innovativen Technologie, der Zugänglichkeit und Benutzerfreundlichkeit der APIs und ihrer Relevanz für verschiedene Branchen.
- OpenAI
- Microsoft Azure
- KI/ML-API
- AWS KI-Dienste
- ParallelDots
- Watsonx
- Rev.ai API
- Wit.ai
- Weniger anzeigen
Wenn es um KI geht, ist Google der erste Name, der einem natürlich in den Sinn kommt.
Und der zweite Name?
Nun, zumindest fällt mir keiner ein! 😂 Google dominiert die Gespräche über KI, und das aus gutem Grund. Im Laufe der Jahre hat das Unternehmen vielleicht Milliarden von Dollar in die KI-Forschung und Talente gesteckt. Mehrere seiner ehrgeizigen KI-Projekte sind bekannt, und ein Blick auf seine neuesten Arbeiten jagt uns einen Schauer über den Rücken:
Aufgrund dieser tiefgreifenden Expertise hat Google einige der hochwertigsten APIs im Bereich KI/ML zu bieten. Werfen wir einen Blick auf einige der wichtigsten Angebote.
Textanalyse (Verarbeitung natürlicher Sprache)
Einige der größten Sprünge in der KI waren das Verständnis und die Arbeit mit natürlichen Sprachen, ob geschrieben oder gesprochen. Die Textanalyse-API von Google ist unglaublich leistungsstark und bietet Funktionen wie:
- Syntaxanalyse (analysieren Sie einen gegebenen Text und identifizieren Sie die wichtigsten Teile)
- Entitätsanalyse (z.B. Rechnungsdaten in unstrukturierten Dokumenten finden)
- Stimmungsanalyse (Erkennen von Stimmungen, Absichten usw. aus dem geschriebenen oder gesprochenen Wort)
- Mehrsprachig (arbeitet mit vielen Sprachen)
Wenn es Sie also juckt, die Stimmung Ihrer Kunden in ihren Support-Chats zu ermitteln, probieren Sie es gleich aus!
Vorhersage
Google bietet einen speziellen Vorhersagedienst an, wenn Sie Ihre eigenen Modelle haben und Vorhersagen für neue Daten erstellen möchten. Es ist sogar möglich, benutzerdefinierten Code hinzuzufügen, falls Sie etwas Ungewöhnliches oder Experimentelles vorhaben. Der Vorhersagedienst ist Teil eines umfassenden Angebots, der KI-Plattform, auf die wir im Folgenden eingehen werden.
KI-Plattform
Diejenigen, die mit Daten und KI arbeiten, wissen, wie mühsam und zeitaufwändig jeder einzelne Schritt des Prozesses sein kann. Um diese Probleme zu lösen, bietet Google eine umfassende End-to-End-Plattform namens KI-Plattform an. Dabei handelt es sich um einen vollständig verwalteten Service für Data Science und ML, der darauf abzielt, die operative Seite von ML und Datenverarbeitung so reibungslos wie möglich zu gestalten.
Wenn Sie also ein nicht-triviales ML-Setup haben und die Schluckaufs und Wartezeiten leid sind, könnte die KI-Plattform von Google einen Blick wert sein.
Es wäre zu viel verlangt, alle KI/ML-Dienste von Google zu beschreiben, daher können Interessierte die offiziellen Dokumente einsehen. Dort gibt es noch viel mehr ernsthafte, unerforschte und atemberaubende Dinge!
OpenAI
Wenn Sie sich auch nur ein bisschen für KI interessieren, haben Sie das Aufkommen von GPT-4 bemerkt. Dabei handelt es sich um ein fortschrittliches ML-Modell für die Arbeit mit natürlichen Sprachen, das alle in Angst und Schrecken versetzt, dass der Tag des Jüngsten Gerichts endlich gekommen ist. Die treibende Kraft hinter GPT-4 ist OpenAI, eine Organisation, die gegründet wurde, um die Forschung und Zusammenarbeit im Bereich der KI zu fördern – und zwar ganz offen, was in der heutigen Welt eine Seltenheit ist.
Das Unternehmen wurde vor allem durch Elon Musk, einen der Gründer, bekannt gemacht, als es für seine KI-Forschung große Aufmerksamkeit in den Medien erhielt. Ein Beispiel dafür war die spielende KI, die mit professionellen DOTA 2-Spielern auf höchstem Niveau spielte und sie vernichtete:
Zum Zeitpunkt der Erstellung dieses Artikels ist Elon Musk nicht mehr beteiligt und OpenAI ist nicht gerade “offen” im Sinne seiner Gründungsprinzipien. Aber das ist eine andere Diskussion, zu der Sie viel Material finden können.
Für uns ist die Quintessenz, dass OpenAI bahnbrechende Arbeit im Bereich der KI leistet, vor allem in den Bereichen Textverarbeitung,Video-/Bildverarbeitung usw. Sie bieten mehrere KI-Dienste als APIs an, und ich bin sicher, dass es für jeden dieser Dienste einen überzeugenden Anwendungsfall gibt:
- Semantische Suche: Ermöglicht die Suche in Freiform-Textdaten, wie z.B. Dokumenten, auf der Grundlage einer in natürlicher Sprache formulierten Anfrage. Wenn Sie also eine digitalisierte Bibliothek aller Chats des Kundensupports haben, können Sie z.B. fragen: “Zeigen Sie mir eine Liste der Chats, in denen die Kunden wegen der verspäteten Lösung sehr verärgert waren”. Dies war kein offizielles Beispiel, aber ich wollte die Möglichkeiten deutlich machen! 😁
- Chatbots: Die meisten Chatbots sind heute nichts anderes als riesige Körbe voller Bedauern. Das Unternehmen, das beschlossen hat, sie einzusetzen, bereut es später, der Entwickler, der den Bot entwickelt hat, bereut diese nutzlose Kreation, der Kunde, der die Website besucht, bereut die Interaktion mit dem Bot . … Sie verstehen, was ich meine. Im Gegensatz dazu sind die Chat-Fähigkeiten von OpenAI weit überlegen, vor allem wenn es um Smalltalk, unerwartete Wendungen im Gespräch, indirekte Absichten usw. geht. Sicher, es ist nicht perfekt, aber es legt die Messlatte hoch genug, um Chatbots von widerwärtig/dumm zu amüsant zu machen.
- Kundenservice: Falls Sie befürchtet haben, dass Sie die beiden oben genannten Dienste irgendwie kombinieren müssen, um einen brauchbaren Kundenservice zu schaffen, hat OpenAI das bereits getan. Es gibt einen eigenen Dienst für den Kundenservice, der über Suchfunktionen, Empfehlungen usw. verfügt.
- Textgenerierung: Ähnlich wie die GPT-3-Technologie, die wir vor einiger Zeit besprochen haben, bietet OpenAI über eine API die Möglichkeit zur Texterstellung. Das Ergebnis ist echter, intelligenter Text über so ziemlich alles (sogar abstraktes und seltsames Zeug), den Sie auf verschiedene kreative Arten verwenden können!
- Verstehen: Dieser Service nimmt einen gegebenen Text und erstellt eine Zusammenfassung davon. Ja, in seinen eigenen Worten! Die Zeitersparnis und die Möglichkeiten, die sich daraus ergeben, sind immens. E-Mail-Müdigkeit ist meiner Meinung nach ein guter Anwendungsfall: Lassen Sie die KI einfach Nachrichten zusammenfassen, damit Sie Ihren Posteingang in 10 Minuten statt in drei Stunden leeren können!
- Andere Tools: OpenAI verfügt auch über einige andere Tools/Dienste, die in der Praxis sehr nützlich sind. So ist es zum Beispiel möglich, semantische Suchergebnisse zur einfachen Analyse in eine Tabelle zu konvertieren. Außerdem gibt es einen Dienst, mit dem Sie Text von einer Sprache in eine andere übersetzen können (ein ziemlich häufiger Bedarf) und so weiter.
OpenAI hat in der Welt der Künstlichen Intelligenz zwar vor kurzem für Furore gesorgt, aber der Zugang zu seinen APIs ist nicht einfach. Sie müssen sich auf eine Warteliste setzen lassen; wer wann und wie zugelassen wird, bleibt ebenfalls ein Geheimnis. Und schließlich sollten Sie nicht vergessen, dass diese Technologien zwar extrem leistungsfähig, aber noch nicht ganz ausgereift sind. Daher auch die Bezeichnung “Beta” für die gesamte Palette der Dienste. Dennoch würde ich sagen, dass es sich lohnt, sich zu bewerben und sie in einem Pilotprojekt auszuprobieren.
Microsoft Azure
Wenn es um Cloud-Angebote geht, liegt Microsoft angeblich weit abgeschlagen an dritter Stelle (nach AWS und Google). Aber das bedeutet nicht, dass das Unternehmen in Schwierigkeiten steckt. Es hat seine eigene spezielle Strategie (Migration bestehender Windows-Unternehmen) und läuft sein eigenes Rennen. Der Name Azure ist zwar bekannt, aber nicht, dass Azure auch ein solides Angebot an KI-bezogenen Diensten hat. Sagen Sie Hallo zu Azure Cognitive Services!
Azure Cognitive Services ist ein vollwertiges KI-Angebot, das so ziemlich alles bietet, was Sie brauchen, um intelligente, leistungsstarke Anwendungen zu entwickeln. Die meisten ihrer APIs haben sogar interessante und spezialisierte Anwendungsfälle, was ihnen meiner Meinung nach einen Vorteil verschafft. Hier ist eine kurze Zusammenfassung der wichtigsten APIs und ihrer Fähigkeiten:
- Sprache: Diese APIs basieren auf dem, was man in der Informatik als natürliche Sprachverarbeitung bezeichnet. Einfacher ausgedrückt, geht es darum, die Bedeutung menschlicher Sprachen (ob gesprochen oder geschrieben) zu extrahieren, zu erzeugen und mit ihnen zu arbeiten. Einige interessante Funktionen sind die Erstellung von Konversations-Fragen (stellen Sie sich die Möglichkeiten für die Ausbildung/Bildung/Einstellung vor!), die Integration von Konversationsintelligenz in IoT- und andere Geräte, die Stimmungsanalyse und andere Metadaten zu einem bestimmten Text, die Übersetzung (derzeit in 60 Sprachen) und vieles mehr.
- Sprache: Diese APIs bieten Apps die Möglichkeit, mit menschlicher Sprache zu arbeiten. Zu den wichtigsten Angeboten gehören die Konvertierung von Sprache in Text, von Text in Sprache, die Sprachübersetzung und die Spracherkennung.
- Bildverarbeitung: Computer Vision ist ein heißes Thema, und obwohl es bei weitem nicht perfekt ist, ist es in Szenarien, in denen ein gewisser Spielraum für Fehler besteht, ausreichend leistungsfähig. Die angebotenen Bildverarbeitungs-APIs umfassen Funktionen wie Bild- und Videoanalyse, Objekterkennung (in Bildern und Videos), Gesichtserkennung, Video-Indexer (Generierung von Metadaten aus Videos) und mehr.
- Entscheidung: Hierbei handelt es sich um eine Reihe von Allzweck-APIs, die entweder zu einer besseren Entscheidungsfindung beitragen oder den Prozess verbessern, den Sie für ML-basierte Entscheidungen anwenden. Zu den angebotenen Funktionen gehören die Erkennung von Anomalien (äußerst nützlich für Datenwissenschaftler), die Moderation von Inhalten, der Personalisierungsdienst (hilft Ihnen, intelligente, personalisierte Interaktionen für Ihre App-Nutzer zu erstellen) und mehr.
Das Microsoft von heute ist ganz anders. Es hat eine klare Vision und konzentriert sich auf die Cloud, Dienste und integrierte Lösungen. Wenn Sie ein Windows-basiertes Unternehmen betreiben, sei es vor Ort oder in der Cloud, macht die Integration der kognitiven Azure-APIs in Ihre Produkte noch mehr Sinn.
KI/ML-API
Die AI/ML API ist eine Plattform, die den Zugriff auf 100 KI-Modelle (z.B. Mixtral, LLaMA, Qwen, Stable Diffusion, Realistic Vision, Falcon usw.) für verschiedene Anwendungen wie prädiktive Analysen, Verarbeitung natürlicher Sprache, Bilderkennung, Computer Vision und mehr ermöglicht.
Die KI/ML-API ist eine ideale Lösung für Unternehmen, Startups und Innovationslabors, die modernste KI-Technologien integrieren möchten, um alles von einfachen Prototypen bis hin zu komplexen KI-Systemen zu entwickeln. Außerdem können Sie diese einsatzbereiten KI-Modelle vollständig an Ihre spezifischen Projektanforderungen anpassen, um optimale Leistung und Relevanz zu erzielen.
Entwickler können die KI/ML-API für eine Reihe von Aufgaben nutzen, z.B. für den Aufbau generativer KI-Chatbots, persönliche Inhaltsempfehlungen, Sprachübersetzung, Stimmungsanalyse, Bildklassifizierung und Objekterkennung. All diese Aufgaben werden durch die umfangreiche Dokumentation und die Entwickler-Tools der AI/ML API vereinfacht. Darüber hinaus sorgen die robusten API-Verbindungen für eine reibungslose Integration mit bestehenden Tech-Stacks, darunter Zapier, Bubble, ProtoPie und Retool.
AI/ML API verfügt über eine serverlose Infrastruktur, mit der Entwickler Kosten für Bereitstellung und Wartung sparen können. Ein großer Vorteil von AI/ML ist die Flexibilität, die es einem Unternehmen ermöglicht, seine Plattform gemäß den lokalen Gesetzen und der Berufsethik zu nutzen, ohne pauschale Verbote auszusprechen.
Ein weiterer Vorteil der AI/ML API ist das Benutzer-Dashboard, mit dem die Benutzer die Nutzung und den API-Zugriff von jedem Gerät aus überwachen können. Außerdem sorgt die 99%ige Betriebszeit für einen nahtlosen Betrieb mit minimalen Unterbrechungen. Diese API ist mit der OpenAI-API-Struktur kompatibel, was bedeutet, dass Entwickler keine größeren Änderungen an der bestehenden Codebasis vornehmen müssen. Stattdessen müssen Sie nur die Endpunkte anpassen und den API-Schlüssel eingeben, um bei ähnlicher Ausgabequalität viel Zeit zu sparen.
AI/ML API Vorteile
- Plattformübergreifende Unterstützung.
- Zugang zu 100 KI-Modellen mit einer einzigen API.
- Einfacher Übergang für bestehende OpenAI API-Nutzer.
- Skalierbarkeit zur Unterstützung von Unternehmen jeder Größe.
AI/ML API Nachteile
- Die Betriebszeit ist für unternehmenskritische Projekte etwas niedrig
- Die Anpassung bestimmter Modelle an sehr spezifische Anwendungsfälle kann zusätzliche Arbeit erfordern.
AI/ML API-Preise
- Kostenloses Tier: Bietet einen grundlegenden Zugang zu den Funktionalitäten der AI/ML API mit einer einwöchigen kostenlosen Testphase.
- Abonnement-Pläne: Maßgeschneiderte Abonnementoptionen für fortgeschrittene Implementierungen, höhere Nutzungslimits und Unternehmenslösungen.
AWS KI-Dienste
Wenn man über Cloud-basierte Dienste und Infrastruktur spricht, ist es unmöglich, Amazon Web Services (AWS) nicht zu erwähnen. Ich konnte keine sehr glaubwürdige Quelle finden, deshalb kann ich sie nicht verlinken, aber anscheinend hat AWS allein einen Anteil von etwa 33% am Cloud-Markt. Und als Entwickler kann ich bestätigen, dass die Plattform eine große Anziehungskraft auf Softwarearchitekten, CTOs, Entwickler, Geschäftsinhaber usw. ausübt.
Wenn es sich um ein neues SaaS-Produkt handelt, möchten die Leute es von Anfang an auf AWS hosten; und wenn jemand Skalierungs- oder Stabilitätsprobleme hat, möchte er es auf AWS verlagern.
Ich behaupte nicht, dass AWS die absolut beste Wahl für eine Cloud-Infrastruktur ist, aber das Angebot an Services und die Niedrigpreisstrategie sind kaum zu überbieten. Wenn Sie KI/ML-Funktionen in Ihre (neuen oder bestehenden) Anwendungen integrieren möchten, können Sie mit den KI-Services von AWS nichts falsch machen.
Hier ist ihr Elevator Pitch:
AWS bietet mehrere leistungsstarke, funktionsreiche Services für KI/ML. Werfen wir einen kurzen Blick auf sie:
- Polly: Text-to-Speech ist heutzutage eine dringend benötigte Fähigkeit, vor allem, weil sie es Unternehmen ermöglicht, wirklich “lebendige”, intelligente Anwendungen zu entwickeln, die sich auch mit einer menschenähnlichen, glaubwürdigen Stimme unterhalten können. Amazon Polly macht genau das. Die Ausgabe ist zwar nicht gerade der Stoff, aus dem die Träume sind (hören Sie sich die offiziellen Hörproben hier und hier an), aber für die meisten Anwendungsfälle ist sie ziemlich gut.
Sind Sie daran interessiert, diese Lösung auszuprobieren? Sehen Sie sich an, wie Sie Artikel in Audio umwandeln können.
- Transkribieren: Dieser Dienst ist das Gegenteil von Polly und wandelt Sprache in Text um. Ich kann seine Effektivität persönlich bezeugen, da ich Transcribe in einem der Projekte verwendet habe, um Aufnahmen von Call Centern zu lesen und eine Transkription zu erstellen. Die Ausgabe war extrem genau (auch hier habe ich keine Statistiken, aber ich würde sagen, dass die Genauigkeit bei über 95 % lag) und es war mühelos in der Lage, verschiedene Akzente zu erkennen, selbst bei einigen Hintergrundgeräuschen. Außerdem war die Menge der erzeugten Metadaten atemberaubend.
- Rekognition: Rekognition ist Amazons Service für Computer Vision (für Bilder und Videos). Neben den Standardfunktionen wie Gesichtserkennung, Objekterkennung, Beschriftung usw. bietet er auch interessante Funktionen wie Inhaltsmoderation (z. B. die Kontrolle darüber, was Ihre Kinder auf ihren Geräten ansehen), Erkennung von Prominenten, Erkennung von Geräten (für die Sicherheit von Mitarbeitern und die Einhaltung von Vorschriften) und vieles mehr.
- Betrugsdetektor: Betrug ist eine Teergrube, die Unternehmen jeden Tag viel Geld und Mühe kostet. Dieser Dienst bietet Hilfe, indem er Funktionen zur Erkennung von Betrug bei der Erstellung neuer Konten, beim Checkout von Gästen, bei Online-Zahlungen, beim Missbrauch von Treueprogrammen usw. anbietet. Dieser Service ist für das Ökosystem des E-Commerce sehr nützlich.
- Lex: Wenn Sie Chatbots lieben, aber die langweiligen, dummen Chatbots, die überall zu finden sind, satt haben, ist Lex genau das Richtige für Sie. Er verfügt über alle Fähigkeiten, die ein moderner Chatbot braucht, und da er ein verwalteter Dienst ist, müssen Sie sich nicht um den Betrieb von Servern kümmern.
- Kendra: Kendra ist ein Dokumentensuchdienst, nur dass die Suchanfragen in menschlicher Sprache erfolgen. Der Service verfügt offenbar über tiefes “Fachwissen” in einigen Branchen, d.h. wenn Ihre Daten zufällig aus einer dieser Branchen stammen, kann die Suche für mehr Genauigkeit feinabgestimmt werden.
AWS hat noch ein paar weitere Services aufgelistet, aber wenn ich versuche, sie alle aufzuzählen, gehen mir Papier und Tinte aus! außerdem, wenn ich eines über AWS weiß, dann, dass es dem Hubble-Gesetz folgt, was zu einem immer größer werdenden Universum führt. Wenn Sie diesen Artikel lesen, könnte sich die Zahl der KI-Services bereits verdoppelt oder sogar verzehnfacht haben! Wenn Sie sich also dafür interessieren, sollten Sie die offizielle Seite besuchen und einige Zeit damit verbringen, die Services, Fähigkeiten, Kosten usw. zu erkunden.
Da AWS den größten Marktanteil hat, ist es wahrscheinlich, dass Sie bereits bei AWS gehostet werden. Oder überlegen Sie vielleicht, Ihre Infrastruktur zu AWS zu verlagern? Wenn ja, können Sie mit AWS AI Services Ihre Anwendungen nahtlos und zuverlässig mit anderen AWS-Services (z. B. S3, EC2, SNS usw.) zusammenarbeiten lassen. Sprechen Sie einfach mit Leuten, die über verschiedene Infrastrukturen verteilte Anwendungen pflegen mussten, und Sie werden für immer überzeugt sein. 😝
ParallelDots
ParallelDots ist zugegebenermaßen nicht annähernd so populär wie die anderen Unternehmen in dieser Liste. Sie sind jedoch ein seltener Fund und ich denke, sie verdienen mehr Aufmerksamkeit.
Das Unternehmen ist in erster Linie ein KI-Unternehmen, das äußerst nützliche Tools und branchenspezifische Lösungen entwickelt. Aber was vielleicht am wichtigsten ist, sie scheinen an Qualität statt an Quantität zu glauben. In ihrem Produktmenü gibt es nur vier Artikel (zumindest bisher), und einer davon stach für mich heraus, weil er generisch und sehr genau ist. Und der Service, über den wir hier sprechen, sind ihre Textanalyse-APIs.
Wenn Sie den obigen Link aufrufen und ein wenig nach unten scrollen, finden Sie eine Art Live-Spielplatz, auf dem Sie einen beliebigen Text eingeben und die Analysefähigkeiten der KI mit einem Mausklick sehen können.
Der Text, den Sie auf dem Screenshot sehen, ist übrigens die Standardeinstellung. Sobald Sie auf die grüne Schaltfläche Analysieren klicken, wird unten die Analyse des Textes nach verschiedenen Kategorien angezeigt (die Kategorien sind die Schaltflächen).
Also, wie gut ist die API? Ich wollte sie selbst testen und habe sie mit einem nicht ganz einfachen Text gefüttert – einem Stück Prosa aus einem der Klassiker der modernen Literatur (für die Neugierigen: Es handelt sich um das Buch On the Road von Jack Kerouac aus dem Jahr 1957). Lassen Sie uns den Text zunächst selbst lesen:
Die einzigen Menschen, die für mich in Frage kommen, sind die Verrückten, die verrückt sind zu leben, verrückt zu reden, verrückt, gerettet zu werden, verrückt nach allem gleichzeitig, die niemals gähnen oder etwas Alltägliches sagen, sondern brennen, brennen, brennen wie fabelhafte gelbe römische Kerzen, die wie Spinnen über den Sternen explodieren.
Was halten Sie von diesem Film? Was versucht es zu vermitteln? Welche Stimmung spiegelt es Ihrer Meinung nach wider? Es wäre gut, innezuhalten und über diese Fragen nachzudenken.
Dann habe ich es in das Textfeld eingefügt und auf Analysieren geklickt. Hier ist das Ergebnis:
Alles in allem, ziemlich gut! Das Stück Prosa, das ich ausgewählt habe, ist ziemlich anspruchsvoll und weist nicht explizit auf etwas hin. Der erfahrene Leser wird jedoch eine deutliche Schattierung von Angst/Angst erkennen, die hervorsticht. Und das ist es auch, was die API als vorherrschende Emotion zeigt! Der Text ist jedoch nicht einfach nur wütend, was sich in der Konfidenzbewertung des API von 30,58% widerspiegelt. Der Wert von fast 20% für “Langeweile” und “Glück” ist ebenfalls sinnvoll, da ich glaube, dass sich diese Emotionen im Text widerspiegeln, wenn auch nicht als dominante. Furcht, Traurigkeit, Aufregung . . nun, wer bin ich, dass ich sagen kann, dass diese im Text nicht vorkommen?! Die Sache ist die, dass Prosa-Komposition und -Verständnis höchst subjektiv sind, wenn Sie also anderer Meinung sind, ist das in Ordnung 🙂
Ich persönlich war jedoch von dem ParallelDots-Service ebenso beeindruckt wie von den anderen Teilen der obigen Analyse. Sicher, er lag nicht immer richtig und in einigen Fällen war er auch seltsam, aber wie ich bereits in diesem Artikel geschrieben habe, ist eine 100%ige Genauigkeit nicht das Ziel (und vielleicht nicht einmal erreichbar). Das Ziel ist eine leistungsstarke KI, die uns hilft, die Art von Anwendungen zu entwickeln, von denen wir seit Jahrzehnten nur träumen können.
Ist der Textanalysedienst von ParallelDots also etwas für Sie?
Ich würde sagen, ja, wenn sich Ihr Bedarf auf die Textanalyse beschränkt, Sie eine extrem hohe Genauigkeit wünschen und Ihnen die mangelnde Aufmerksamkeit, die Sie als Kunde erhalten, wenn Sie sich für einen der großen Namen in diesem Bereich entscheiden, nicht gefällt.
Watsonx
Es ist noch nicht lange her, da war das Watson-Projekt von IBM die allmächtige KI, die den Menschen ein für alle Mal ersetzen sollte. Sie erstellte Filmtrailer, schlug die besten Spieler in Jeopardy und so weiter. Das Ende ist nah, davon war jeder im Herzen überzeugt. Spulen Sie ins Jahr 2020 vor, und Watson ist nicht mehr im Gedächtnis der Öffentlichkeit.
Aber das bedeutet nicht, dass es sich um ein Eintagsfliege-Projekt handelte, das später in die Tonne getreten wurde. Die KI blieb zwar hinter ihrem epischen Potenzial zurück (oder war es vielleicht die ganze Zeit eine PR-Strategie?!), aber Watson lebt weiter als das Gehirn in IBMs KI-Angeboten für Unternehmen.
Hier sind die wichtigsten Dienste, die unter dem Dach von Watson Solutions angeboten werden:
- Watson Assistant: Dieser Service enthält viele Komponenten, die den Kundenservice verbessern sollen – sowohl für den Kunden als auch für den Agenten! Watson Assistant hilft Agenten dabei, schnell Informationen zu finden, um Anfragen zu lösen, Kundenanfragen zu verstehen und zu personalisieren, detaillierte Daten und Metriken bereitzustellen und aus diesen Daten Erkenntnisse zu gewinnen – all das bietet Watson Assistant.
- RegTech: IBM RegTech ist ein schwergewichtiger Service, der darauf abzielt, die Einhaltung von Vorschriften zu verbessern und das Risikomanagement in alle Ebenen der Geschäftstätigkeit eines Unternehmens zu integrieren. Auf einer feineren Ebene zielt er auch auf Schlüsselprobleme wie Zahlungsbetrug, Finanzkriminalität usw. ab.
- Watson Health: Watson Health ist ein hochspezialisierter KI-Dienst für die Gesundheitsbranche. Zu seinen Fähigkeiten gehören die Unterstützung bei datenbezogenen Anforderungen in der Forschung, der bildgebenden Diagnostik, der Optimierung von Gesundheitsplänen hinsichtlich Kosten und Qualität usw.
- AIOps: AI Ops = AIOps, sagt IBM. Es handelt sich um einen spezialisierten KI-Service zur Optimierung des IT-Betriebs. Die IT-Toolchain und der IT-Betrieb können so umfangreich und komplex werden, dass keine Lösung auf Unternehmensebene praktikabel erscheint. In diesen Szenarien hilft AIOps bei der frühzeitigen Erkennung von Problemen, der Ausfallsicherheit von Lösungen, der Verbesserung der Entscheidungsfindung und vielem mehr.
- Watson Media: Der Watson Media Service ist auf Live-Video-Streaming in großem Umfang spezialisiert. Dank der KI ist er in der Lage, Untertitel zu generieren, Videos zu durchsuchen, Videoanalysen durchzuführen usw., und zwar in Echtzeit. Da Sicherheitskameras ebenfalls eine Form des Live-Streamings sind, eignet sich Watson Media auch hier für die Erkennung von Bedrohungen, Objekten usw.
Es gibt noch eine Reihe weiterer KI-Dienste von IBM, die Sie hier kennenlernen können. IBM ist eine solide Wahl für KI-Dienste, aber denken Sie daran, dass die Positionierung und die Angebote des Unternehmens auf große bis sehr große Unternehmen ausgerichtet sind, stellen Sie also sicher, dass sie zueinander passen.
Rev.ai API
Rev.ai ist ein weiteres KI-Unternehmen, das an die Entwicklung von Fachwissen glaubt und ein paar Dinge gut macht. Nur haben sie beschlossen, nur eine Sache gut zu machen. Ja, nur eine! Die Umwandlung von Sprache in Text. Ja, das ist buchstäblich alles, was sie anbieten! Es gibt nicht einmal Text-to-Speech, geschweige denn andere Kategorien von KI/ML.
Und das Ergebnis dieser übertriebenen, an Wahnsinn grenzenden Besessenheit? Extreme Genauigkeit, wohl die beste unter den Besten der Welt. Den Beweis für ihre KI liefern sie auf dieser Seite.
Wie Sie sehen können, zeigen ihre Tests, dass Rev.ai viel genauer ist als Googles Speech-to-Text. Es gibt viele ähnliche Vergleiche auf dieser Seite (die alle mit Google verglichen werden und zeigen, dass sie Google schlagen), aber leider gibt es keinen Live-Spielplatz (ich frage mich, warum; verbraucht er viel Rechenleistung? Irgendein anderer Grund?). Das heißt aber nicht, dass Sie den Dienst nicht testen können; Sie können ein kostenloses Konto erstellen und die API so genau unter die Lupe nehmen, wie Sie möchten 🙂
Es kann sein, dass Rev.ai in Zukunft weitere Dienste einführt und ich mich bemühe, diesen Artikel zu “korrigieren”. Aber das ist heute noch nicht der Fall. Wenn Sie also einen Sprache-zu-Text-Dienst ohne Kompromisse bei der Genauigkeit wünschen, verdient Rev.ai Ihre Aufmerksamkeit.
Wit.ai
Wit.ai ist eine KI-Plattform, die sowohl in der Sprach- als auch in der Textverarbeitung über fortschrittliche Fähigkeiten verfügt. Ja, das klingt wie jeder andere NLP- und Textanalyse-/Transkriptionsdienst da draußen, aber es gibt noch mehr:
- Wit.ai ist Open Source. Es steht Ihnen also nichts im Wege, von der Technologie des Unternehmens zu lernen oder die Plattform in Ihrer Infrastruktur zu hosten.
- Wit.ai ist nicht nur ein Code-Dump, der auf GitHub liegt – es ist auch ein echter, laufender API-Dienst (in Form von HTTP-APIs), den jeder nutzen kann.
- Der API-Dienst ist kostenlos. Ja, völlig kostenlos! Er ist sogar so kostenlos, dass es keine Preispläne gibt. 🤣🤣
- Wit.ai soll erweiterbar sein. Das heißt, sein Hauptzweck besteht mehr oder weniger darin, Ihnen beim Erstellen, Trainieren, Testen und Verwenden von ML-Modellen zu helfen (Sie dazu zu drängen?).
Der letzte Punkt in der obigen Liste (über die Erweiterbarkeit) muss etwas näher erläutert werden, also fangen wir an: Wit.ai soll zwischen dem Benutzer und dem Gerät sitzen, das Befehle entgegennimmt und Aktionen ausführt. Der Benutzer spricht oder textet mit Wit.ai, das die Nachricht analysieren und Metadaten generieren kann. Sobald Wit.ai herausgefunden hat, was der Benutzer tun möchte (achten Sie auf “Absicht” im Screenshot oben) und wie er es tun möchte (die anderen Details im Screenshot: Aufgabe und Datum), sendet es die entsprechenden Befehle und Informationen an das Gerät.
Ich muss betonen, dass Wit.ai von Haus aus nur über sehr wenige Funktionen verfügt. Die ganze Idee ist, Sie dazu zu bringen, Ihre eigenen ML-Modelle zu erstellen, ein Prozess, der im Allgemeinen frustrierend ist, aber mit Wit.ai Spaß macht und einfach ist. Und genau hier liegt seine Stärke. Und falls Sie sich entscheiden, die kostenlose API zu nutzen, sollten Sie bedenken, dass es Ratenbeschränkungen gibt (etwa 100-250 Anfragen pro Minute, je nach Endpunkt).
Fazit
Künstliche Intelligenz (KI), maschinelles Lernen (ML), neuronale Netze, Daten, Modelle, Training, Vorhersage … all dies sind keine Schlagworte mehr. Und wie es bei jeder bahnbrechenden Technologie der Fall ist, ist KI, sobald sie sich stabilisiert hat, zur Massenware geworden. Die in diesem Artikel besprochenen Plattformen stellen allen dieselben Superkräfte zur Verfügung, egal ob Sie ein junges Startup oder ein branchenweit tätiger Gigant sind.