Geekflare recibe el apoyo de nuestra audiencia. Podemos ganar comisiones de afiliación de los enlaces de compra en este sitio.
En AI Última actualización: 29 de septiembre de 2023
Compartir en:
Escáner de seguridad de aplicaciones web Invicti - la única solución que ofrece verificación automática de vulnerabilidades con Proof-Based Scanning™.

Por primera vez en la historia del software, las empresas pueden crear aplicaciones que sean realmente inteligentes.

¿Y lo mejor?

Aprovechar esta inteligencia no es diferente de acceder a las API, gracias a varias plataformas de IA que lideran el cambio. Si usted es una empresa, no puede ignorar las posibilidades que ofrecen estos servicios.

Durante 2010-20, entramos oficialmente en la era de la Inteligencia Artificial (IA). La mayoría de la gente está mirando a su alrededor y diciendo: “¿Eh, me he perdido algo?”, porque esto no se parece en nada al bombo que los “evangelistas” de la IA y la cultura popular han estado difundiendo. No hay ejércitos de calamares gigantes de metal que aniquilar ni juegos mentales que jugar con una inteligencia similar a la humana.

Sin embargo, como siempre hace la tecnología, la IA se ha colado silenciosamente en casi todo lo que nos rodea. Y aunque podría decirse que esta tecnología de apariencia mágica no es inteligente por sí misma -al menos en un sentido humano-, sus aplicaciones, cuando se hacen correctamente, producen resultados casi mágicos. Puede que la IA no tenga nada que altere la vida de la persona media (sólo mejoras cotidianas, grandes o pequeñas); para las empresas, tiene un potencial ilimitado de creatividad, velocidad, crecimiento y mucho más.

Tecnologías como el reconocimiento facial, el reconocimiento de objetos, el reconocimiento de voz, etc., prometen una experiencia del cliente muy superior y una ventaja casi injusta sobre la competencia. No es de extrañar que todas las empresas estén creando una división de IA o pensando en ello. Afortunadamente, no hay necesidad de contratar a un ejército de doctores; la Inteligencia Artificial (o el Aprendizaje Automático, para ser más exactos) ha madurado hasta el punto de que varios actores importantes -así como de nicho- están ofreciendo servicios de IA como las buenas y viejas API REST.

Por unos pocos dólares en total, y en algunos casos de forma gratuita, puede evaluar estos servicios y ver si ofrecen una propuesta de valor sólida para los ciclos de vida de su empresa.

Sí, una vez que haya finalizado un servicio y empiece a utilizarlo en producción, lo que debe vigilar estrictamente es la factura mensual. La IA/ML consiste esencialmente en agitar cantidades masivas de datos sobre un conjunto distribuido de servidores muy potentes (la mayoría utilizan chips de procesadores que se encuentran en las tarjetas gráficas); naturalmente, trabajar con grandes datos y grandes cálculos costará más.

“¡¿Qué ‘soporte’ al cliente?!”

Por favor, no me malinterprete.

Mi intención no es ni disentir de estas empresas ni desanimar a nadie a sumergirse en las aguas de la IA. Estas empresas tienen sus planes de precios detallados (o los facilitan si se les solicita); más allá de esto, no pueden hacer gran cosa. Así que, cuando el uso no se supervisa (o peor aún, un sistema automatizado tiene un fallo que provoca, digamos, que la RAM del servidor se llene y se siga replicando en cada nueva máquina creada para manejar esta “carga” ), la responsabilidad -al igual que en el caso de su factura de la luz- recae sobre usted.

¿La solución?

Es bastante sencilla. La gran mayoría de los proveedores de servicios disponen de un sistema de alerta en el que puede especificar una cantidad que funcione como umbral de alerta (digamos, 500 $/mes). Así, en cuanto su consumo durante un mes supere los 500 dólares, el sistema enviará correos electrónicos, mensajes de texto y lo que no a todas las personas mencionadas en la sección de notificaciones. Será difícil pasar por alto tal pánico. 😄 Entonces, ¿cuál es la lección del día? Este sistema de alerta financiera es una de las primeras cosas que debería conocer; también debería ser una de las primeras, quizá incluso la primera cosa que configure y pruebe. Confíe en mí; algún día me agradecerá el consejo.

Muy bien, ¡basta de cháchara! Sigamos con la lista de plataformas de IA que me han parecido impresionantes y lo que tienen que ofrecer.

Google

Cuando se trata de IA, Google es el primer nombre que naturalmente viene a la mente.

¿Y el segundo nombre?

Bueno, ¡al menos a mí no se me ocurre ninguno! 😂 Google domina las conversaciones sobre IA, y por una buena razón. A lo largo de los años, la empresa ha invertido quizás miles de millones de dólares en investigación y talento en IA. Varios de sus ambiciosos proyectos de IA son bien conocidos, y un vistazo a sus últimos trabajos produce escalofríos:

YouTube vídeo

Gracias a esta profunda experiencia, Google dispone de algunas de las API de mayor calidad que se pueden ofrecer en IA/ML. Veamos algunas de sus principales ofertas.

Análisis de textos (procesamiento del lenguaje natural)

Algunos de los mayores saltos en IA han sido la comprensión y el trabajo con lenguajes naturales, ya sean escritos o hablados. La API de análisis de texto de Google es increíblemente potente y ofrece funciones como:

  • Análisis sintáctico (analizar un texto dado e identificar las partes clave)
  • Análisis de entidades (encontrar datos de facturas en documentos no estructurados, por ejemplo)
  • Análisis de sentimientos (identificar el estado de ánimo, la intención, etc., a partir de la palabra escrita o hablada)
  • Multilingüe (funciona con muchos idiomas)

Así que, si está deseando conocer el sentimiento de sus clientes a partir de sus chats de asistencia, ¡pruébelo ahora mismo!

Predicción

Google dispone de un servicio de predicción dedicado por si tiene sus propios modelos y desea generar predicciones sobre nuevos datos. Incluso es posible añadir código personalizado en caso de que quiera hacer algo no estándar o experimental. El servicio de predicción forma parte de una oferta integral denominada Plataforma de IA, de la que hablaremos a continuación.

Plataforma de IA

Quienes trabajan con datos e IA saben lo engorroso y lento que puede resultar cada paso del proceso. Para solucionar estos inconvenientes, Google ofrece una plataforma integral de principio a fin denominada Plataforma de IA. Se trata de un servicio totalmente gestionado para la ciencia de datos y el ML y su objetivo es hacer que la parte operativa del ML y la gestión de datos sea lo más fluida posible.

Por lo tanto, si tiene una configuración de ML no trivial y está cansado de los contratiempos y las esperas, puede que merezca la pena echar un vistazo a la Plataforma de IA de Google.

Sería pedir demasiado describir cada uno de los servicios de IA/ML de Google, así que los interesados pueden dirigirse a los documentos oficiales. Allí hay muchas más cosas serias, inexploradas y asombrosas

OpenAI

Si se interesa mínimamente por el espacio de la IA, habrá notado la aparición de GPT-3. Se trata de un modelo de ML avanzado para trabajar con lenguajes naturales y tenía (¿tiene?) a todo el mundo asustado de que por fin hubiera llegado el día del juicio final. La fuerza que hay detrás de GPT-3 es OpenAI, una organización creada para fomentar la investigación y la colaboración en el espacio de la IA, todo ello en abierto, lo cual es una rareza en el mundo actual.

La empresa fue popularizada sobre todo por Elon Musk, uno de sus fundadores, cuando recibió una enorme atención mediática por sus investigaciones sobre IA. Un ejemplo fue la IA que jugó y destruyó a jugadores profesionales de DOTA 2 al más alto nivel:

YouTube vídeo

En el momento de escribir estas líneas, Elon Musk ya no está involucrado, y OpenAI no es exactamente “abierta” según sus principios fundacionales. Pero esa es otra discusión, y puede encontrar abundante material al respecto.

Para nosotros, lo esencial es que OpenAI está realizando un trabajo seriamente innovador en IA, especialmente en lo que se refierealprocesamientode textos, vídeo/imágenes, etc. Ofrecen varios servicios de IA como API, y estoy seguro de que es fácil ver un caso de uso sólido para cada uno de ellos:

  • Búsqueda semántica: Permite buscar en datos de texto de forma libre, como documentos, basándose en una consulta proporcionada en un lenguaje natural. Así, si dispone de una biblioteca digitalizada de todos los chats de atención al cliente, puede preguntar cosas como “muéstreme una lista de los chats en los que los clientes estaban muy enfadados por la tardanza en la resolución”. Este no era un ejemplo oficial, ¡pero quería dejar claras las posibilidades! 😁
  • Chatbots: La mayoría de los chatbots actuales no son más que enormes cestas llenas de lamentos. La empresa que decidió desplegarlos se arrepiente después, el desarrollador que creó el bot se arrepiente de esta creación inútil, el cliente que navega por el sitio se arrepiente de haber interactuado con el bot . . ya se hace una idea. Por el contrario, las capacidades de chat de OpenAI son muy superiores, especialmente cuando se trata de conversaciones triviales, giros inesperados de la conversación, intención indirecta, etc. Claro que no es perfecto, pero sube el listón lo suficiente como para que los chatbots pasen de ser odiosos/tontos a divertidos.
  • Atención al cliente: Si le preocupaba tener que combinar de algún modo los dos servicios anteriores para crear una experiencia viable de atención al cliente, OpenAI ya lo ha hecho. Hay un servicio dedicado a la atención al cliente que tiene capacidades de búsqueda, recomendaciones, etc.
  • Generación de texto: Muy parecida a la tecnología GPT-3 de la que hablamos hace un tiempo, OpenAI ofrece capacidades de generación de texto a través de la API. El resultado es un texto real e inteligente sobre prácticamente cualquier cosa (incluso cosas abstractas y extrañas) que puede utilizar de diversas formas creativas
  • Comprensión: Este servicio toma un texto dado y produce un resumen del mismo. Sí, ¡en sus propias palabras! La cantidad de tiempo que esto puede ahorrar y el alcance de algo tan útil es inmenso. En mi opinión, la fatiga del correo electrónico es un buen caso de uso: ¡simplemente haga que la IA resuma los mensajes para que pueda vaciar su bandeja de entrada en 10 minutos en lugar de en tres horas!
  • Otras herramientas: OpenAI también cuenta con algunas otras herramientas/servicios que resultan útiles durante su uso en el mundo real. Por ejemplo, es posible convertir los resultados de una búsqueda semántica en una hoja de cálculo para facilitar su análisis; también hay un servicio para traducir texto de un idioma a otro (una necesidad bastante común); etc.

Aunque OpenAI ha causado un gran revuelo en el mundo de la IA recientemente, el acceso a sus API no es fácil. Hay que solicitar entrar en una lista de espera; quién obtiene la aprobación, cuándo y cómo… esto también sigue siendo un misterio. Por último, no olvide que aunque estas tecnologías son extremadamente potentes, no están totalmente maduras. De ahí la etiqueta “beta” en toda su gama de servicios. Aun así, yo diría que merece la pena solicitarlo y probarlo en un proyecto piloto.

Microsoft Azure

Cuando se trata de ofertas en la nube, se dice que Microsoft ocupa un distante tercer lugar (después de AWS y Google, claro). Pero eso no significa que la empresa esté en apuros; tiene su propia estrategia especial (migrar los negocios existentes de Windows) y está corriendo su propia carrera. Aunque el nombre Azure es bien conocido, lo que no lo es es que Azure también cuenta con un sólido conjunto de ofertas en lo que se refiere a servicios relacionados con la IA. ¡Salude a Azure Cognitive Services!

Y por si pensaba que Microsoft no ha hecho nada en el espacio de la IA, vea esto:

YouTube vídeo

AzureCognitive Services es una oferta de IA en toda regla que tiene prácticamente todo lo que necesita para crear aplicaciones inteligentes y potentes. De hecho, la mayoría de sus API tienen casos de uso interesantes y más especializados, lo que, en mi opinión, les da ventaja. He aquí un rápido resumen de las principales API que tienen y cuáles son sus capacidades:

  • Lenguaje: Estas API se construyen en torno a lo que en informática se denomina Procesamiento del Lenguaje Natural. En términos más sencillos, se trata de extraer significado de, generar y trabajar con lenguajes humanos (ya sean hablados o escritos). Algunas capacidades interesantes son el creador de QnA conversacional (¡imagine las posibilidades en formación/educación/contratación!), la infusión de inteligencia conversacional en IoT y otros dispositivos, el análisis de sentimientos y otros metadatos sobre un texto dado, la traducción (60 idiomas en el momento de escribir), y mucho más.
  • Voz: Estas API proporcionan a las aplicaciones la capacidad de trabajar con el habla humana. Las ofertas clave incluyen la conversión de voz a texto, la conversión de texto a voz, la traducción de voz y el reconocimiento de voz.
  • Visión: La visión por ordenador ha sido un tema candente y, aunque dista mucho de ser perfecta, es lo suficientemente capaz en escenarios en los que existe cierto margen de error. Las API de visión que se ofrecen incluyen capacidades como el análisis de imágenes y vídeos, el reconocimiento de objetos (en imágenes y vídeos), la detección de rostros, el indexador de vídeos (generación de metadatos a partir de vídeos), etc.
  • Decisión: Se trata de un conjunto de API de propósito general que ayudan a tomar mejores decisiones o a mejorar el proceso que se sigue para tomar decisiones basadas en ML. Las capacidades que ofrece esta gama son la detección de anomalías (extremadamente útil para los científicos de datos), la moderación de contenidos, el servicio de personalización (le ayuda a crear interacciones inteligentes y personalizadas para los usuarios de su aplicación), y mucho más.

La Microsoft de hoy es muy diferente, con una visión clara y centrada en la nube, los servicios y las soluciones integradas. Si está ejecutando una operación basada en Windows, ya sea en las instalaciones o en la nube, integrar las API cognitivas de Azure en sus productos tiene aún más sentido.

AWS AI Services

Cuando se habla de servicios e infraestructuras basados en la nube, es imposible no mencionar Amazon Web Services (AWS). No he podido encontrar una fuente de gran credibilidad, así que no puedo enlazarla, pero al parecer, sólo AWS tiene alrededor del 33% de la cuota de mercado de la nube. Y como desarrollador, puedo dar fe del poderoso tirón que tiene la plataforma para todo tipo y tamaño de arquitectos de software, directores técnicos, desarrolladores, propietarios de empresas, etc.

Si se trata de un nuevo producto SaaS, la gente quiere alojarlo en AWS desde el principio; y si alguien tiene problemas de escalado o estabilidad, quiere trasladarlo a AWS.

No digo que AWS sea la mejor opción absoluta para la infraestructura en la nube, pero su gama de servicios y su estrategia de precios bajos son difíciles de superar. La cuestión es que, si en su lista está incorporar capacidades de IA/ML a sus aplicaciones (nuevas o existentes), nunca se equivocará con los servicios de IA de AWS.

Aquí está su discurso de ascensor:

YouTube vídeo

AWS ofrece varios servicios potentes y ricos en características en lo que se refiere a IA/ML. Echémosles un rápido vistazo:

  • Polly: La conversión de texto a voz es una capacidad muy necesaria hoy en día, sobre todo porque permite a las empresas crear aplicaciones verdaderamente “vivas” e inteligentes que también pueden conversar con una voz similar a la humana y creíble. Amazon Polly hace precisamente eso. Aunque el resultado no es exactamente la materia de los sueños (escuche las muestras oficiales aquí y aquí), es bastante bueno para la mayoría de los casos de uso.

¿Le interesa probar esta solución? Compruebe cómo puede convertir artículos en audio.

  • Transcribir: Este servicio es el reverso de Polly, ya que convierte la voz en texto. Puedo atestiguar personalmente su eficacia, ya que utilicé Transcribe en uno de los proyectos para leer grabaciones de centros de llamadas y producir una transcripción. El resultado fue extremadamente preciso (de nuevo, no tengo estadísticas, pero diría que tuvo una precisión superior al 95%), y fue capaz de captar sin esfuerzo diferentes acentos incluso con algo de ruido de fondo. Además, la cantidad de metadatos que generó fue asombrosa.
  • Rekognition: Rekognition es el servicio de Amazon para visión por ordenador (para imágenes y vídeos). Además de las cosas estándar como el reconocimiento facial, la detección de objetos, el etiquetado, etc., también tiene capacidades interesantes como la moderación de contenidos (controlar lo que sus hijos están viendo en sus dispositivos, por ejemplo), el reconocimiento de celebridades, el reconocimiento de equipos (para la seguridad y el cumplimiento de los trabajadores), y mucho más.
  • Detector de fraudes: El fraude es un pozo de alquitrán que cuesta mucho dinero y esfuerzo a las empresas cada día. Este servicio proporciona ayuda ofreciendo capacidades de detección de fra udes en la creación de nuevas cuentas, el pago de invitados, el pago en línea, el abuso de programas de fidelización, etc. Evidentemente, este servicio sería muy útil para el ecosistema del comercio electrónico.
  • Lex: Si los chatbots son su amor, pero está cansado de los aburridos y tontos chatbots que se encuentran habitualmente en todas partes, Lex es lo que debe explorar. Tiene todas las capacidades que necesita un chatbot moderno y, como es un servicio gestionado, no tiene que preocuparse de ejecutar servidores.
  • Kendra: Kendra es un servicio de búsqueda de documentos, salvo que las consultas de búsqueda son en lenguaje humano. Al parecer, el servicio cuenta con una profunda “experiencia” en algunas industrias, lo que significa que si sus datos pertenecen a una de ellas, la búsqueda puede afinarse para mayor precisión.

Hay algunos servicios más en la lista de AWS, pero si intento abarcarlos todos, ¡me quedaré sin papel ni tinta! 😁 Además, si algo sé de AWS es que sigue la Ley de Hubble, lo que resulta en un universo en constante expansión. Para cuando esté leyendo este artículo, ¡su número de servicios de IA podría haberse duplicado o incluso multiplicado por diez! Así que, si le interesa, le animo a que visite la página oficial y dedique algún tiempo a explorar los servicios, las capacidades, el coste, etc.

Dado que AWS tiene la mayor cuota de mercado, lo más probable es que usted ya esté alojado en AWS. ¿O tal vez esté considerando cambiar su infraestructura a AWS? Si es así, elegir los servicios de IA de AWS permitirá que sus aplicaciones funcionen con otros servicios de AWS (piense en S3, EC2, SNS, etc.) sin problemas y de forma fiable. Sólo tiene que hablar con gente que haya tenido que mantener aplicaciones divididas entre distintas infraestructuras y se convencerá de por vida. 😝

ParallelDots

Hay que reconocer que ParallelDots no es ni de lejos tan popular como las empresas de esta lista hasta ahora. Sin embargo, son un hallazgo raro y creo que merecen más visibilidad.

Siendo principalmente una empresa de IA, crean herramientas muy útiles y soluciones específicas para cada sector. Pero quizá lo más importante es que parecen creer en la calidad por encima de la cantidad; en su menú de productos, sólo hay cuatro artículos (al menos por ahora), y uno de ellos destacó para mí por ser genérico y muy preciso. Y el servicio del que estamos hablando es su API de análisis de texto.

Si visita el enlace anterior y se desplaza un poco hacia abajo, encontrará una especie de zona de juegos en vivo, donde puede introducir cualquier texto y ver las capacidades de análisis de la IA con sólo pulsar un botón.

El texto que ve en la captura de pantalla es el predeterminado que han establecido, por cierto. Una vez que pulsa el botón verde Analizar, aparece a continuación el análisis del texto según varias categorías (las categorías son los botones).

Entonces, ¿hasta qué punto es buena la API? Se me ocurrió hacer algunas pruebas por mi cuenta, así que le introduje algo no tan sencillo: un fragmento de prosa tomado de uno de los clásicos de la literatura moderna (para los curiosos, el libro es On the Road, de Jack Kerouac, escrito en 1957). Primero leamos nosotros mismos el texto:

Las únicas personas para mí son los locos, los que están locos por vivir, locos por hablar, locos por salvarse, deseosos de todo al mismo tiempo, los que nunca bostezan ni dicen una cosa vulgar, sino que arden, arden, arden como fabulosas velas romanas amarillas que estallan como arañas a través de las estrellas.

¿Qué le parece? ¿Qué intenta transmitir? ¿Qué estado de ánimo cree que refleja? Sería bueno hacer una pausa y reflexionar sobre estas preguntas.

Luego lo pegué en el cuadro de texto y le di a Analizar. Esto es lo que apareció:

En conjunto, ¡bastante bien! El trozo de prosa que seleccioné es bastante desafiante y no indica nada explícitamente. Sin embargo, el lector sofisticado detectará un claro matiz de angustia/enojo que destaca. ¡Y eso es también lo que muestra el API como emoción dominante! Sin embargo, el texto no está simplemente enfadado, lo que se refleja en la puntuación de confianza del API del 30,58%. La puntuación cercana al 20% asignada al “aburrimiento” y la “felicidad” también tiene sentido, ya que creo que estas emociones se reflejan en el texto, aunque no como dominantes. Miedo, tristeza, emoción . . bueno, ¿quién soy yo para decir que están ausentes del texto? La cosa es que la composición y la comprensión de la prosa son muy subjetivas, así que si no está de acuerdo conmigo, no pasa nada 🙂

Sin embargo, personalmente, salí igualmente impresionado con el servicio de ParallelDots al explorar otras partes del análisis anterior. Claro que no dio en el blanco todo el tiempo y, en algunos casos, también fue raro; pero como escribí antes en este artículo, el objetivo no es una precisión del 100% (y quizá ni siquiera sea alcanzable). El objetivo es una IA potente que nos ayude a construir el tipo de aplicaciones con las que sólo hemos podido soñar durante décadas.

Entonces, ¿es el servicio de análisis de textos de ParallelDots para usted?

Yo diría que sí si sus necesidades se limitan al análisis de texto, desea una precisión extremadamente alta y no le gusta la falta de atención que recibe como cliente cuando elige entre los grandes nombres del sector.

IBM Watson

No hace mucho, el proyecto Watson de IBM era la todopoderosa IA que sustituiría a los humanos de una vez por todas. Creaba trailers de películas, ganaba a los mejores jugadores en Jeopardy, etc. El fin está cerca; todo el mundo estaba convencido en el fondo de su corazón. Avancemos rápido hasta 2020, y Watson ya no está en la memoria del público.

Pero eso no significa que fuera un proyecto relámpago que luego se tiró a la basura. Aunque la IA no alcanzó su épico potencial (¡¿o quizá fue una estrategia de relaciones públicas todo el tiempo?!), Watson sigue vivo como el cerebro de la oferta de IA de IBM para las empresas.

https://www.youtube.com/watch?v=r7E1TJ1HtM0

He aquí los servicios clave que se ofrecen bajo el paraguas de las soluciones Watson:

  • Asistente Watson: Este servicio contiene muchos componentes orientados a mejorar la experiencia del servicio de atención al cliente, ¡tanto para el cliente como para el agente! Ayudar a los agentes a encontrar información rápidamente para resolver dudas, comprender las consultas de los clientes y personalizar su recorrido, proporcionar datos y métricas detallados y extraer ideas de esos datos… Watson Assistant lo hace todo.
  • RegTech: IBM RegTech es un servicio de peso destinado a mejorar el cumplimiento e integrar la gestión de riesgos en todas las capas de las operaciones de una organización. A un nivel más fino, también se dirige a preocupaciones clave como el fraude en los pagos, los delitos financieros, etc.
  • Watson Health: Watson Health es un servicio de IA altamente especializado para el sector sanitario. Ayudar con las necesidades relacionadas con los datos en la investigación, el diagnóstico por imagen, la optimización de los planes sanitarios en cuanto a costes y calidad, etc., son algunas de sus capacidades.
  • AIOps: AI Ops = AIOps, dice IBM. Se trata de un servicio de IA especializado para optimizar las operaciones de TI. La cadena de herramientas de TI y las operaciones de TI pueden llegar a ser tan grandes y complejas que ninguna solución parece viable a nivel empresarial. En estos escenarios, AIOps ayuda con la detección temprana de problemas, la resistencia de las soluciones, la mejora de la toma de decisiones y mucho más.
  • Watson Media: El servicio Watson Media está especializado en la transmisión de vídeo en directo a escala. La parte de IA lo hace capaz de generar subtítulos, buscar vídeos, analizar vídeos, etc., sobre la marcha. Dado que las transmisiones de las cámaras de seguridad son también una forma de retransmisión en directo, Watson Media encaja también ahí para la detección de amenazas, el reconocimiento de objetos, etc.

Hay un par de servicios de IA más de IBM, y puede conocerlos todos aquí. IBM es una opción sólida para los servicios de IA, pero recuerde que su posicionamiento y ofertas están optimizados hacia las empresas grandes a muy grandes, así que asegúrese de que es un ajuste mutuo.

Rev.ai

Rev.ai es otra de esas empresas de IA que creen en el desarrollo de la experiencia y en hacer unas pocas cosas bien. Excepto que han decidido hacer sólo una cosa bien. Sí, ¡sólo una! Conversión de voz a texto. Sí, ¡eso es literalmente todo lo que ofrecen! Ni siquiera hay conversión de texto a voz, por no hablar de otras categorías de IA/ML.

Los lectores de Geekflare tienen un 10% de descuento en Rev.

¿Y el resultado de esta obsesión híper, rayana en la locura? Una precisión extrema, posiblemente la mejor entre las mejores del mundo. Y ofrecen pruebas de su IA en esta página.

Como puede ver, sus pruebas muestran que Rev.ai es mucho más precisa que la conversión de voz a texto de Google. Hay muchas comparaciones similares en esa página (todas comparadas y mostradas superando a Google), aunque lamentablemente no hay ningún campo de juego en vivo (me pregunto por qué; ¿se utiliza mucha potencia de cálculo? ¿algún otro motivo?). Pero eso no significa que no pueda evaluar el servicio; puede crear una cuenta gratuita y escudriñar la API tan de cerca como desee 🙂

Es posible que Rev.ai lance más servicios en el futuro, y me apresuro a “arreglar” este artículo. Sin embargo, hoy no es el caso, así que si desea un servicio de voz a texto sin comprometer la precisión, Rev.ai merece su atención.

Wit.ai

Wit.ai es una plataforma de IA que cuenta con capacidades avanzadas en el procesamiento del habla y del texto. Sí, eso suena como cualquier otro servicio de PNL y análisis/transcripción de texto que existe, pero hay más:

  • Wit.ai es de código abierto. Por tanto, nada le impide aprender de su tecnología o alojar la plataforma en su infraestructura.
  • Wit.ai no es sólo un volcado de código que yace en GitHub: es también un servicio API real y en funcionamiento (en forma de API HTTP), que está abierto para que cualquiera pueda utilizarlo.
  • El servicio API es gratuito. Sí, ¡totalmente gratis! De hecho, es tan gratuito que no existen planes de precios. 🤣🤣
  • Wit.ai está pensado para ser extensible. Es decir, su propósito principal es más o menos ayudarle (¿empujarle?) a crear, entrenar, probar y utilizar modelos ML.

El último punto de la lista anterior (sobre la extensibilidad) necesita algo de desembalaje, así que aquí va: Wit.ai está pensado para situarse entre el usuario y el dispositivo que recibe órdenes y realiza acciones. El usuario habla o envía un texto a Wit.ai, que puede analizar el mensaje y generar metadatos. Una vez que ha averiguado qué quiere hacer el usuario (busque “intención” en la captura de pantalla anterior) y cómo quiere hacerlo (los otros detalles de la captura de pantalla: tarea y fecha y hora), envía las órdenes y la información pertinentes al dispositivo.

Debo insistir: fuera de la plataforma, Wit.ai tiene muy pocas capacidades. La idea es empujarle a crear sus propios modelos ML, un proceso que suele ser frustrante pero que Wit.ai hace divertido y fácil. Y ahí es donde reside su fuerza. Y oh, en caso de que decida utilizar la API gratuita, tenga en cuenta que existen límites de velocidad (aproximadamente 100-250 peticiones por minuto, dependiendo del endpoint).

Conclusión

Inteligencia Artificial (IA), Aprendizaje Automático (AM), Redes Neuronales, datos, modelos, formación, predicción. . . nada de esto son ya palabras de moda. Y como ocurre con cualquier tecnología innovadora, una vez que se ha estabilizado, la IA se ha comoditizado. Las plataformas analizadas en este artículo ponen a disposición de todo el mundo los mismos superpoderes, tanto si se trata de una incipiente startup como de un gigante devorador de industrias.

No olvide explorar estos cursos para aprender IA.

Esto me obliga a advertir a las partes interesadas: la IA/ML (con API o sin API) no aumentará, por sí sola, mágicamente su crecimiento (al igual que “hacerse social” no consigue nada por sí solo). Aunque emocionante, la IA ha creado un campo de juego nivelado. El resto depende de nosotros 🙂

A continuación, explore algunos de los mejores marcos de IA para crear aplicaciones modernas.

  • Ankush
    Autor
    Escribo sobre, alrededor y para el ecosistema de los desarrolladores. Recomendaciones, tutoriales, debates técnicos... Sea lo que sea lo que publique, hago todo lo posible por eliminar la confusión y la palabrería y ofrecer respuestas prácticas basadas en la experiencia personal... Seguir leyendo
Gracias a nuestros patrocinadores
Más lecturas sobre IA
Potencia tu negocio
Algunas de las herramientas y servicios que le ayudarán a hacer crecer su negocio.
  • Invicti utiliza el Proof-Based Scanning™ para verificar automáticamente las vulnerabilidades identificadas y generar resultados procesables en tan solo unas horas.
    Pruebe Invicti
  • Web scraping, proxy residencial, gestor de proxy, desbloqueador web, rastreador de motores de búsqueda, y todo lo que necesita para recopilar datos web.
    Pruebe Brightdata
  • Monday.com es un sistema operativo de trabajo todo en uno que te ayuda a gestionar proyectos, tareas, trabajo, ventas, CRM, operaciones, flujos de trabajo y mucho más.
    Prueba Monday
  • Intruder es un escáner de vulnerabilidades en línea que encuentra puntos débiles de ciberseguridad en su infraestructura, para evitar costosas violaciones de datos.
    Prueba Intruder