Una API de IA permite a las empresas integrar funciones inteligentes en las aplicaciones mediante sencillas interfaces de programación de aplicaciones.
Desde 2010, hemos entrado en la era de la Inteligencia Artificial (IA), en la que tecnologías como el reconocimiento facial y el reconocimiento de voz ofrecen experiencias superiores a los clientes y ventajas competitivas. Las empresas no necesitan contratar a un equipo de doctores; muchos actores importantes y especializados ofrecen servicios de IA maduros a través de API REST. Estas API, a menudo disponibles por un coste mínimo o incluso gratuitas, permiten a las empresas incorporar fácilmente funcionalidades de IA y mejorar sus operaciones comerciales.
Por unos pocos dólares en total, y en algunos casos de forma gratuita, puede evaluar estos servicios y ver si ofrecen una propuesta de valor sólida para sus ciclos de vida empresariales. Veamos ahora las principales plataformas API de IA en función de su tecnología innovadora, la accesibilidad y facilidad de uso de las API y su relevancia en los distintos sectores.
- OpenAI
- Microsoft Azure
- API DE IA/ML
- Servicios de IA de AWS
- ParallelDots
- Watsonx
- API Rev.ai
- Wit.ai
- Mostrar menos
Cuando se habla de IA, Google es el primer nombre que viene a la mente de forma natural.
¿Y el segundo nombre?
Bueno, ¡al menos a mí no se me ocurre ninguno! 😂 Google domina las conversaciones sobre IA, y por una buena razón. A lo largo de los años, la empresa ha invertido quizás miles de millones de dólares en investigación y talento en IA. Varios de sus ambiciosos proyectos de IA son bien conocidos, y un vistazo a sus últimos trabajos produce escalofríos:
Gracias a esta profunda experiencia, Google dispone de algunas de las API de mayor calidad que se pueden ofrecer en IA/ML. Veamos algunas de sus principales ofertas.
Análisis de textos (procesamiento del lenguaje natural)
Algunos de los mayores saltos en IA han sido la comprensión y el trabajo con lenguajes naturales, ya sean escritos o hablados. La API de análisis de texto de Google es increíblemente potente y ofrece funciones como:
- Análisis sintáctico (analizar un texto dado e identificar las partes clave)
- Análisis de entidades (encontrar datos de facturas en documentos no estructurados, por ejemplo)
- Análisis de sentimientos (identificar el estado de ánimo, la intención, etc., a partir de la palabra escrita o hablada)
- Multilingüe (funciona con muchos idiomas)
Así que, si está deseando conocer el sentimiento de sus clientes a partir de sus chats de asistencia, ¡pruébelo ahora mismo!
Predicción
Google dispone de un servicio de predicción dedicado por si tiene sus propios modelos y desea generar predicciones sobre nuevos datos. Incluso es posible añadir código personalizado en caso de que quiera hacer algo no estándar o experimental. El servicio de predicción forma parte de una oferta integral denominada Plataforma de IA, de la que hablaremos a continuación.
Plataforma de IA
Quienes trabajan con datos e IA saben lo engorroso y lento que puede resultar cada paso del proceso. Para solucionar estos inconvenientes, Google ofrece una plataforma integral de principio a fin denominada Plataforma de IA. Se trata de un servicio totalmente gestionado para la ciencia de datos y el ML y su objetivo es hacer que la parte operativa del ML y la gestión de datos sea lo más fluida posible.
Por lo tanto, si tiene una configuración de ML no trivial y está cansado de los contratiempos y las esperas, puede que merezca la pena echar un vistazo a la Plataforma de IA de Google.
Sería pedir demasiado describir cada uno de los servicios de IA/ML de Google, así que los interesados pueden dirigirse a los documentos oficiales. Allí hay muchas más cosas serias, inexploradas y asombrosas
OpenAI
Si se interesa mínimamente por el espacio de la IA, habrá notado la aparición de GPT-4. Se trata de un modelo avanzado de ML para trabajar con lenguajes naturales, y tiene a todo el mundo temiendo que por fin haya llegado el día del juicio final. La fuerza que hay detrás de GPT-4 es OpenAI, una organización creada para fomentar la investigación y la colaboración en el espacio de la IA, todo ello en abierto, lo cual es una rareza en el mundo actual.
La empresa fue popularizada sobre todo por Elon Musk, uno de sus fundadores, cuando recibió una enorme atención mediática por sus investigaciones sobre IA. Un ejemplo fue la IA que jugó y destruyó a jugadores profesionales de DOTA 2 al más alto nivel:
En el momento de escribir estas líneas, Elon Musk ya no está involucrado, y OpenAI no es exactamente «abierta» según sus principios fundacionales. Pero esa es otra discusión, y puede encontrar abundante material al respecto.
Para nosotros, lo esencial es que OpenAI está realizando un trabajo seriamente innovador en IA, especialmente en lo que se refiere al procesamientode textos, vídeo/imágenes, etc. Ofrecen varios servicios de IA como API, y estoy seguro de que es fácil ver un caso de uso sólido para cada uno de ellos:
- Búsqueda semántica: Permite buscar en datos de texto de forma libre, como documentos, basándose en una consulta proporcionada en un lenguaje natural. Así, si dispone de una biblioteca digitalizada de todos los chats de atención al cliente, puede preguntar cosas como «muéstreme una lista de los chats en los que los clientes estaban muy enfadados por la tardanza en la resolución». Este no era un ejemplo oficial, ¡pero quería dejar claras las posibilidades! 😁
- Chatbots: La mayoría de los chatbots actuales no son más que enormes cestas llenas de lamentos. La empresa que decidió desplegarlos se arrepiente después, el desarrollador que creó el bot se arrepiente de esta creación inútil, el cliente que navega por el sitio se arrepiente de haber interactuado con el bot . . ya se hace una idea. Por el contrario, las capacidades de chat de OpenAI son muy superiores, especialmente cuando se trata de conversaciones triviales, giros inesperados de la conversación, intención indirecta, etc. Claro que no es perfecto, pero sube el listón lo suficiente como para que los chatbots pasen de ser odiosos/tontos a divertidos.
- Atención al cliente: Si le preocupaba tener que combinar de algún modo los dos servicios anteriores para crear una experiencia viable de atención al cliente, OpenAI ya lo ha hecho. Hay un servicio dedicado a la atención al cliente que tiene capacidades de búsqueda, recomendaciones, etc.
- Generación de texto: Muy parecida a la tecnología GPT-3 de la que hablamos hace un tiempo, OpenAI ofrece capacidades de generación de texto a través de la API. El resultado es un texto real e inteligente sobre prácticamente cualquier cosa (incluso cosas abstractas y extrañas) que puede utilizar de diversas formas creativas
- Comprensión: Este servicio toma un texto dado y produce un resumen del mismo. Sí, ¡en sus propias palabras! La cantidad de tiempo que esto puede ahorrar y el alcance de algo tan útil es inmenso. En mi opinión, la fatiga del correo electrónico es un buen caso de uso: ¡simplemente haga que la IA resuma los mensajes para que pueda vaciar su bandeja de entrada en 10 minutos en lugar de en tres horas!
- Otras herramientas: OpenAI también cuenta con algunas otras herramientas/servicios que resultan útiles durante su uso en el mundo real. Por ejemplo, es posible convertir los resultados de una búsqueda semántica en una hoja de cálculo para facilitar su análisis; también hay un servicio para traducir texto de un idioma a otro (una necesidad bastante común); etc.
Aunque OpenAI ha causado un gran revuelo en el mundo de la IA recientemente, el acceso a sus API no es fácil. Hay que solicitar entrar en una lista de espera; quién obtiene la aprobación, cuándo y cómo… esto también sigue siendo un misterio. Por último, no olvide que aunque estas tecnologías son extremadamente potentes, no están totalmente maduras. De ahí la etiqueta «beta» en toda su gama de servicios. Aun así, yo diría que merece la pena solicitarlo y probarlo en un proyecto piloto.
Microsoft Azure
Cuando se trata de ofertas en la nube, se dice que Microsoft ocupa un distante tercer lugar (después de AWS y Google, claro). Pero eso no significa que la empresa esté en apuros; tiene su propia estrategia especial (migrar los negocios existentes de Windows) y está corriendo su propia carrera. Aunque el nombre Azure es bien conocido, lo que no lo es es que Azure también cuenta con un sólido conjunto de ofertas en lo que se refiere a servicios relacionados con la IA. Salude a Azure Cognitive Services
AzureCognitive Services es una oferta de IA en toda regla que tiene prácticamente todo lo que necesita para crear aplicaciones inteligentes y potentes. De hecho, la mayoría de sus API tienen casos de uso interesantes y más especializados, lo que, en mi opinión, les da una ventaja. He aquí un rápido resumen de las principales API que tienen y cuáles son sus capacidades:
- Lenguaje: Estas API se construyen en torno a lo que en informática se denomina Procesamiento del Lenguaje Natural. En términos más sencillos, se trata de extraer significado de, generar y trabajar con lenguajes humanos (ya sean hablados o escritos). Algunas capacidades interesantes son el creador de QnA conversacional (¡imagine las posibilidades en formación/educación/contratación!), la infusión de inteligencia conversacional en IoT y otros dispositivos, el análisis de sentimientos y otros metadatos sobre un texto dado, la traducción (60 idiomas en el momento de escribir), y mucho más.
- Voz: Estas API proporcionan a las aplicaciones la capacidad de trabajar con el habla humana. Las ofertas clave incluyen la conversión de voz a texto, la conversión de texto a voz, la traducción de voz y el reconocimiento de voz.
- Visión: La visión por ordenador ha sido un tema candente y, aunque dista mucho de ser perfecta, es lo suficientemente capaz en escenarios en los que existe cierto margen de error. Las API de visión que se ofrecen incluyen capacidades como el análisis de imágenes y vídeos, el reconocimiento de objetos (en imágenes y vídeos), la detección de rostros, el indexador de vídeos (generación de metadatos a partir de vídeos), etc.
- Decisión: Se trata de un conjunto de API de propósito general que ayudan a tomar mejores decisiones o a mejorar el proceso que se sigue para tomar decisiones basadas en ML. Las capacidades que ofrece esta gama son la detección de anomalías (extremadamente útil para los científicos de datos), la moderación de contenidos, el servicio de personalización (le ayuda a crear interacciones inteligentes y personalizadas para los usuarios de su aplicación), y mucho más.
La Microsoft de hoy es muy diferente, con una visión clara y centrada en la nube, los servicios y las soluciones integradas. Si está llevando a cabo una operación basada en Windows, ya sea en las instalaciones o en la nube, integrar las API cognitivas de Azure en sus productos tiene aún más sentido.
API AI/ML
La API AI/ML es una plataforma que permite acceder a 100 modelos de IA (por ejemplo, Mixtral, LLaMA, Qwen, Stable Diffusion, Realistic Vision, Falcon, etc.) para diversas aplicaciones, como el análisis predictivo, el procesamiento del lenguaje natural, el reconocimiento de imágenes, la visión por ordenador, etc.
La API AI/ML es una solución ideal para empresas, startups y laboratorios de innovación que buscan integrar tecnologías de IA de vanguardia para construir desde simples prototipos hasta complejos sistemas de IA. Además, uno puede personalizar completamente estos modelos de IA listos para su despliegue según las necesidades específicas de su proyecto para obtener un rendimiento y una relevancia óptimos.
Los desarrolladores pueden recurrir a la API de IA/ML para una serie de tareas, como la creación de chatbots de IA generativa, la realización de recomendaciones personales de contenidos, la traducción de idiomas, el análisis de sentimientos, la clasificación de imágenes y la detección de objetos. Todo este trabajo se facilita con la amplia documentación y las herramientas para desarrolladores de la API AI/ML. Además, sus sólidas conexiones API garantizan una integración sin problemas con las pilas tecnológicas existentes, como Zapier, Bubble, ProtoPie y Retool.
La API AI/ML presume de una infraestructura sin servidor que ayuda a los desarrolladores a ahorrar costes de despliegue y mantenimiento. Una gran ventaja de utilizar AI/ML es la flexibilidad que ofrece a una empresa para utilizar su plataforma según las leyes locales y la ética profesional, sin imponer prohibiciones generales.
Otra ventaja de la API AI/ML es su panel de control de usuario, que permite supervisar fácilmente el uso y el acceso a la API desde cualquier dispositivo. Además, su tiempo de actividad del 99% garantiza un funcionamiento sin problemas con interrupciones mínimas. Esta API es compatible con la estructura de la API OpenAI, lo que significa que los desarrolladores no tienen que hacer grandes modificaciones en el código base existente. En su lugar, basta con ajustar los puntos finales e introducir la clave de la API para ahorrar enormemente para obtener una calidad de salida similar.
Pros de la API AI/ML
- Compatibilidad entre plataformas.
- Acceso a 100 modelos de IA con una única API.
- Fácil transición para los usuarios existentes de la API OpenAI.
- Escalabilidad para dar soporte a organizaciones de cualquier tamaño.
Contras de la API de IA/ML
- El tiempo de actividad es un poco bajo para proyectos de misión crítica
- La adaptación de ciertos modelos a casos de uso muy específicos puede requerir trabajo adicional.
Precios de la API AI/ML
- Nivel gratuito: Ofrece acceso básico a las funcionalidades de la API AI/ML con una semana de prueba gratuita.
- Planes de suscripción: Opciones de suscripción a medida para implementaciones avanzadas, límites de uso más elevados y soluciones empresariales.
Servicios de IA de AWS
Cuando se habla de servicios e infraestructuras basados en la nube, es imposible no mencionar Amazon Web Services (AWS). No he podido encontrar una fuente de gran credibilidad, así que no puedo enlazarla, pero al parecer, sólo AWS tiene alrededor del 33% de la cuota de mercado de la nube. Y como desarrollador, puedo dar fe del poderoso tirón que tiene la plataforma para todo tipo y tamaño de arquitectos de software, directores técnicos, desarrolladores, propietarios de empresas, etc.
Si se trata de un nuevo producto SaaS, la gente quiere alojarlo en AWS desde el principio; y si alguien tiene problemas de escalado o estabilidad, quiere trasladarlo a AWS.
No digo que AWS sea la mejor opción absoluta para la infraestructura en la nube, pero su gama de servicios y su estrategia de precios bajos son difíciles de superar. La cuestión es que, si en su lista está incorporar capacidades de IA/ML a sus aplicaciones (nuevas o existentes), nunca se equivocará con los servicios de IA de AWS.
Este es su discurso:
AWS ofrece varios servicios potentes y ricos en características en lo que se refiere a IA/ML. Echémosles un rápido vistazo:
- Polly: La conversión de texto a voz es una capacidad muy necesaria hoy en día, sobre todo porque permite a las empresas crear aplicaciones inteligentes realmente «vivas» que también pueden conversar con una voz creíble y similar a la humana. Amazon Polly hace precisamente eso. Aunque el resultado no es exactamente la materia de los sueños (escuche las muestras oficiales aquí y aquí), es bastante bueno para la mayoría de los casos de uso.
¿Le interesa probar esta solución? Compruebe cómo puede convertir artículos en audio.
- Transcribe: Este servicio es el reverso de Polly, ya que convierte la voz en texto. Puedo atestiguar personalmente su eficacia, ya que utilicé Transcribe en uno de los proyectos para leer grabaciones de centros de llamadas y producir una transcripción. El resultado fue extremadamente preciso (de nuevo, no tengo estadísticas, pero diría que tuvo una precisión superior al 95%), y fue capaz de captar sin esfuerzo diferentes acentos incluso con algo de ruido de fondo. Además, la cantidad de metadatos que generó fue asombrosa.
- Rekognition: Rekognition es el servicio de Amazon para visión por ordenador (para imágenes y vídeos). Además de las cosas estándar como el reconocimiento facial, la detección de objetos, el etiquetado, etc., también tiene capacidades interesantes como la moderación de contenidos (controlar lo que sus hijos están viendo en sus dispositivos, por ejemplo), el reconocimiento de celebridades, el reconocimiento de equipos (para la seguridad y el cumplimiento de los trabajadores), y mucho más.
- Detector de fraudes: El fraude es un pozo de alquitrán que cuesta mucho dinero y esfuerzo a las empresas cada día. Este servicio proporciona ayuda ofreciendo capacidades de detección de fra udes en la creación de nuevas cuentas, el pago de invitados, el pago en línea, el abuso de programas de fidelización, etc. Evidentemente, este servicio sería muy útil para el ecosistema del comercio electrónico.
- Lex: Si los chatbots son su amor, pero está cansado de los aburridos y tontos chatbots que se encuentran habitualmente en todas partes, Lex es lo que debe explorar. Tiene todas las capacidades que necesita un chatbot moderno y, como es un servicio gestionado, no tiene que preocuparse de ejecutar servidores.
- Kendra: Kendra es un servicio de búsqueda de documentos, salvo que las consultas de búsqueda son en lenguaje humano. Al parecer, el servicio cuenta con una profunda «experiencia» en algunas industrias, lo que significa que si sus datos pertenecen a una de ellas, la búsqueda puede afinarse para mayor precisión.
Hay algunos servicios más en la lista de AWS, pero si intento abarcarlos todos, ¡me quedaré sin papel ni tinta! 😁 Además, si algo sé de AWS es que sigue la Ley de Hubble, lo que resulta en un universo en constante expansión. Para cuando esté leyendo este artículo, ¡su número de servicios de IA podría haberse duplicado o incluso multiplicado por diez! Así que, si le interesa, le animo a que visite la página oficial y dedique algún tiempo a explorar los servicios, las capacidades, el coste, etc.
Dado que AWS tiene la mayor cuota de mercado, lo más probable es que usted ya esté alojado en AWS. ¿O tal vez esté considerando cambiar su infraestructura a AWS? Si es así, elegir los servicios de IA de AWS permitirá que sus aplicaciones funcionen con otros servicios de AWS (piense en S3, EC2, SNS, etc.) sin problemas y de forma fiable. Sólo tiene que hablar con gente que haya tenido que mantener aplicaciones divididas entre distintas infraestructuras y se convencerá de por vida. 😝
ParallelDots
Hay que reconocer que ParallelDots no es ni de lejos tan popular como las empresas de esta lista hasta ahora. Sin embargo, son un hallazgo raro y creo que merecen más visibilidad.
Siendo principalmente una empresa de IA, crean herramientas muy útiles y soluciones específicas para cada sector. Pero quizá lo más importante es que parecen creer en la calidad por encima de la cantidad; en su menú de productos, sólo hay cuatro artículos (al menos por ahora), y uno de ellos destacó para mí por ser genérico y muy preciso. Y el servicio del que estamos hablando es su API de análisis de texto.
Si visita el enlace anterior y se desplaza un poco hacia abajo, encontrará una especie de zona de juegos en vivo, donde puede introducir cualquier texto y ver las capacidades de análisis de la IA con sólo pulsar un botón.
El texto que ve en la captura de pantalla es el predeterminado que han establecido, por cierto. Una vez que pulsa el botón verde Analizar, aparece a continuación el análisis del texto según varias categorías (las categorías son los botones).
Entonces, ¿hasta qué punto es buena la API? Se me ocurrió hacer algunas pruebas por mi cuenta, así que le introduje algo no tan sencillo: un fragmento de prosa tomado de uno de los clásicos de la literatura moderna (para los curiosos, el libro es On the Road, de Jack Kerouac, escrito en 1957). Primero leamos nosotros mismos el texto:
Las únicas personas para mí son los locos, los que están locos por vivir, locos por hablar, locos por salvarse, deseosos de todo al mismo tiempo, los que nunca bostezan ni dicen un lugar común, sino que arden, arden, arden como fabulosas velas romanas amarillas que estallan como arañas a través de las estrellas.
¿Qué le parece? ¿Qué intenta transmitir? ¿Qué estado de ánimo cree que refleja? Sería bueno hacer una pausa y reflexionar sobre estas preguntas.
Luego lo pegué en el cuadro de texto y le di a Analizar. Esto es lo que apareció:
En conjunto, ¡bastante bien! El trozo de prosa que seleccioné es bastante desafiante y no indica nada explícitamente. Sin embargo, el lector sofisticado detectará un claro matiz de angustia/enojo que destaca. ¡Y eso es también lo que muestra el API como emoción dominante! Sin embargo, el texto no está simplemente enfadado, lo que se refleja en la puntuación de confianza del API del 30,58%. La puntuación cercana al 20% asignada al «aburrimiento» y la «felicidad» también tiene sentido, ya que creo que estas emociones se reflejan en el texto, aunque no como dominantes. Miedo, tristeza, emoción . . bueno, ¿quién soy yo para decir que están ausentes del texto? La cosa es que la composición y la comprensión de la prosa son muy subjetivas, así que si no está de acuerdo conmigo, no pasa nada 🙂
Sin embargo, personalmente, salí igualmente impresionado con el servicio de ParallelDots al explorar otras partes del análisis anterior. Claro que no dio en el blanco todo el tiempo y, en algunos casos, también fue raro; pero como escribí antes en este artículo, el objetivo no es una precisión del 100% (y quizá ni siquiera sea alcanzable). El objetivo es una IA potente que nos ayude a construir el tipo de aplicaciones con las que sólo hemos podido soñar durante décadas.
Entonces, ¿es el servicio de análisis de textos de ParallelDots para usted?
Yo diría que sí si sus necesidades se limitan al análisis de texto, desea una precisión extremadamente alta y no le gusta la falta de atención que recibe como cliente cuando elige entre los grandes nombres del sector.
Watsonx
No hace mucho, el proyecto Watson de IBM era la todopoderosa IA que sustituiría a los humanos de una vez por todas. Creaba trailers de películas, ganaba a los mejores jugadores en Jeopardy, etc. El fin está cerca; todo el mundo estaba convencido en el fondo de su corazón. Avance rápido hasta 2020 y Watson ya no está en la memoria del público.
Pero eso no significa que fuera un proyecto relámpago que luego se tiró a la basura. Aunque la IA no alcanzó su épico potencial (¡¿o quizá fue una estrategia de relaciones públicas todo el tiempo?!), Watson sigue vivo como el cerebro de las ofertas de IA de IBM para las empresas.
He aquí los servicios clave que se ofrecen bajo el paraguas de las soluciones Watson:
- Asistente Watson: Este servicio contiene muchos componentes orientados a mejorar la experiencia del servicio de atención al cliente, ¡tanto para el cliente como para el agente! Ayudar a los agentes a encontrar información rápidamente para resolver dudas, comprender las consultas de los clientes y personalizar su recorrido, proporcionar datos y métricas detallados y extraer ideas de esos datos… Watson Assistant lo hace todo.
- RegTech: IBM RegTech es un servicio de peso destinado a mejorar el cumplimiento e integrar la gestión de riesgos en todas las capas de las operaciones de una organización. A un nivel más fino, también se dirige a preocupaciones clave como el fraude en los pagos, los delitos financieros, etc.
- Watson Health: Watson Health es un servicio de IA altamente especializado para el sector sanitario. Ayudar con las necesidades relacionadas con los datos en la investigación, el diagnóstico por imagen, la optimización de los planes sanitarios en cuanto a costes y calidad, etc., son algunas de sus capacidades.
- AIOps: AI Ops = AIOps, dice IBM. Se trata de un servicio de IA especializado para optimizar las operaciones de TI. La cadena de herramientas de TI y las operaciones de TI pueden llegar a ser tan grandes y complejas que ninguna solución parece viable a nivel empresarial. En estos escenarios, AIOps ayuda con la detección temprana de problemas, la resistencia de las soluciones, la mejora de la toma de decisiones y mucho más.
- Watson Media: El servicio Watson Media está especializado en la transmisión de vídeo en directo a escala. La parte de IA lo hace capaz de generar subtítulos, buscar vídeos, analizar vídeos, etc., sobre la marcha. Dado que las transmisiones de las cámaras de seguridad también son una forma de transmisión en directo, Watson Media también encaja ahí para la detección de amenazas, el reconocimiento de objetos, etc.
Existen varios servicios más de IA de IBM, y puede conocerlos todos aquí. IBM es una opción sólida para los servicios de IA, pero recuerde que su posicionamiento y ofertas están optimizados hacia las empresas grandes a muy grandes, así que asegúrese de que es un ajuste mutuo.
API Rev.ai
Rev.ai es otra de esas empresas de IA que creen en el desarrollo de la experiencia y en hacer unas pocas cosas bien. Excepto que han decidido hacer sólo una cosa bien. Sí, ¡sólo una! Conversión de voz a texto. Sí, ¡eso es literalmente todo lo que ofrecen! Ni siquiera hay conversión de texto a voz, por no hablar de otras categorías de IA/ML.
¿Y el resultado de esta obsesión híper, rayana en la locura? Una precisión extrema, posiblemente la mejor entre las mejores del mundo. Y ofrecen pruebas de su IA en esta página.
Como puede ver, sus pruebas muestran que Rev.ai es mucho más precisa que la conversión de voz a texto de Google. Hay muchas comparaciones similares en esa página (todas comparadas y mostradas superando a Google), aunque lamentablemente no hay ningún campo de juego en vivo (me pregunto por qué; ¿se utiliza mucha potencia de cálculo? ¿algún otro motivo?). Pero eso no significa que no pueda evaluar el servicio; puede crear una cuenta gratuita y escudriñar la API tan de cerca como desee 🙂
Es posible que Rev.ai lance más servicios en el futuro, y me apresuro a «arreglar» este artículo. Sin embargo, hoy no es el caso, así que si desea un servicio de voz a texto sin comprometer la precisión, Rev.ai merece su atención.
Wit.ai
Wit.ai es una plataforma de IA que cuenta con capacidades avanzadas en el procesamiento del habla y del texto. Sí, eso suena como cualquier otro servicio de PNL y análisis/transcripción de texto que existe, pero hay más:
- Wit.ai es de código abierto. Por tanto, nada le impide aprender de su tecnología o alojar la plataforma en su infraestructura.
- Wit.ai no es sólo un volcado de código que yace en GitHub: es también un servicio API real y en funcionamiento (en forma de API HTTP), que está abierto para que cualquiera pueda utilizarlo.
- El servicio API es gratuito. Sí, ¡totalmente gratuito! De hecho, es tan gratuito que no existen planes de precios. 🤣🤣
- Wit.ai está pensado para ser extensible. Es decir, su propósito principal es más o menos ayudarle (¿empujarle?) a crear, entrenar, probar y utilizar modelos ML.
El último punto de la lista anterior (sobre la extensibilidad) necesita algo de desembalaje, así que aquí va: Wit.ai está pensado para situarse entre el usuario y el dispositivo que recibe órdenes y realiza acciones. El usuario habla o envía un texto a Wit.ai, que puede analizar el mensaje y generar metadatos. Una vez que ha averiguado qué quiere hacer el usuario (busque «intención» en la captura de pantalla anterior) y cómo quiere hacerlo (los otros detalles de la captura de pantalla: tarea y fecha y hora), envía las órdenes y la información pertinentes al dispositivo.
Debo insistir: fuera de la plataforma, Wit.ai tiene muy pocas capacidades. La idea es empujarle a crear sus propios modelos ML, un proceso que suele ser frustrante pero que Wit.ai hace divertido y fácil. Y ahí es donde reside su fuerza. Y oh, en caso de que decida utilizar la API gratuita, tenga en cuenta que existen límites de velocidad (aproximadamente 100-250 peticiones por minuto, dependiendo del endpoint).
Conclusión
Inteligencia Artificial (IA), Aprendizaje Automático (AM), Redes Neuronales, datos, modelos, formación, predicción. . . nada de esto son ya palabras de moda. Y como ocurre con cualquier tecnología innovadora, una vez que se ha estabilizado, la IA se ha comoditizado. Las plataformas de las que se habla en este artículo ponen los mismos superpoderes al alcance de todos, tanto si se trata de una incipiente startup como de un monstruo devorador de industrias.