Todo sobre el reconocimiento facial para empresas

El reconocimiento facial para empresas abarca el uso de la tecnología en la mejora de la seguridad organizativa y comercial para mejorar la experiencia del cliente, así como la eficacia operativa. Esta tecnología de reconocimiento facial utiliza algoritmos informáticos para la identificación de personas autorizadas basándose en su rostro.

El reconocimiento facial para empresas ayuda de las siguientes maneras:

Asegurando un mejor control de acceso
Controlar el tiempo y la asistencia
Proporcionando autenticación de clientes
Mejorando la autorización de pagos
Mejorando la seguridad así como la vigilancia

Si usted es un líder empresarial y se ha estado preguntando a qué viene todo este alboroto y si hay alguna utilidad en este nuevo desarrollo, le tenemos cubierto. En este artículo, veremos la historia del reconocimiento facial, su desarrollo, usos actuales, controversias, despliegue y muchas facetas más.

Al final del mismo, tendrá una idea sólida de en qué consiste la tecnología del Reconocimiento Facial y cuáles son sus implicaciones para las empresas, entre otras:

Precisión del reconocimiento facial
Usos del reconocimiento facial
Comparaciones de las API de reconocimiento facial más populares

Empecemos

Evolución del reconocimiento facial

La tecnología existe desde hace algún tiempo por todo el bombo y la cobertura mediática que rodea al reconocimiento facial. El primer trabajo algorítmico serio en la detección de rostros fue el Viola-Jones Object Detection Framework publicado en 2001. Aunque se trataba de un marco de propósito general para identificar objetos dentro de imágenes, se aplicó rápidamente a la detección de rostros con muy buen éxito. La principal razón de la popularidad de este algoritmo fue su velocidad; mientras que el proceso de entrenamiento era insoportablemente lento, el proceso de detección era extremadamente rápido.

Ya en 2001/2004, el ordenador de sobremesa medio que ejecutaba este algoritmo era capaz de procesar un fotograma de 300px X 300px en 0,07 segundos (más información aquí). Los índices de precisión, aunque no eran comparables a los que pueden alcanzar los humanos, eran impresionantes: un 90%.

Sin embargo, no se hicieron verdaderos progresos hasta la década 2010-2020, cuando las redes neuronales convolucionales emergieron como el mejor método para realizar la detección facial. La razón fue la disponibilidad de potencia bruta de procesamiento y memorias de sistema gigantescas puestas a disposición a través de la computación en nube por los proveedores de infraestructura como servicio (IaaS). Por primera vez en la historia, los ordenadores superaban sistemáticamente a los humanos en el reconocimiento de rostros, especialmente cuando se trataba de un gran número de rostros aleatorios.

¿Cómo funciona el reconocimiento facial?

El reconocimiento facial es un proceso de varias etapas en el que intervienen varios subsistemas especializados.

He aquí lo que significan las distintas etapas:

Detección / Seguimiento: Esta parte de la etapa de preprocesamiento se encarga de identificar y rastrear los rostros en el archivo de imagen o vídeo dado. Una vez completado este proceso, sabemos con certeza que hay un rostro en la entrada dada, y se puede seguir procesando. La fase de rastreo también es responsable de rastrear ciertas partes, rasgos particulares o expresiones en un rostro, en caso de que sea necesario.

Alineación: El problema del reconocimiento facial se complica porque los rostros de una imagen o un vídeo dados no siguen ninguna pauta. La persona puede estar acercada o alejada, asomarse por detrás de un árbol o estar presente en un perfil lateral, lo que dificulta aún más el problema de la detección de rostros. Aquí es donde entra en juego la alineación de rostros: nos indica en qué parte de la imagen/vídeo dado se alinea el rostro y cuáles son los contornos de los rasgos faciales.

Extracción de rasgos: Como su nombre indica, durante esta fase del proceso (ahora estamos en la etapa de reconocimiento), se extraen los rasgos individuales del rostro, como los ojos, la nariz, la barbilla, los labios, etc., de forma que los algoritmos puedan utilizarlos en la siguiente etapa. En esta etapa, el ordenador ha recopilado suficientes datos complejos para distinguir un rostro de forma única.

Cotejo/clasificación de rasgos: En esta etapa, las entradas recibidas de la extracción de rasgos se cotejan con la base de datos dada para deducir la identidad de la persona. Esta fase también se conoce como clasificación porque el algoritmo puede ser necesario para categorizar los rostros en lugar de identificarlos individualmente.

Una vez finalizado este proceso, se sabe con certeza si el rostro dado forma parte de la base de datos con la que se ha comparado o no. El resultado final también puede contener etiquetas, como las que estamos acostumbrados a ver en Facebook.

Consideraciones sobre la implantación: Del lado del servidor frente al lado del cliente

El reconocimiento facial puede funcionar tanto en el servidor como en el dispositivo con el que interactúa el usuario. Por ejemplo, cuando sube una foto a Facebook, los algoritmos se ejecutan en el lado del servidor; por otro lado, un sistema de identificación que utiliza su cara para desbloquear el dispositivo debe ejecutarse en el lado del cliente. Entonces, ¿cuál es mejor?

Sinceramente, no se trata de cuál es mejor. Tanto la implantación del lado del servidor como la del lado del cliente tienen sus puntos fuertes; en la práctica, las empresas implantan un sistema híbrido. La práctica recomendada es entrenar sus modelos en el lado del servidor, donde los datos de entrenamiento y los recursos de procesamiento son ilimitados. Una vez entrenados los modelos, éstos pueden empaquetarse y desplegarse en el lado del cliente, lo que mejora la velocidad del sistema y mantiene la privacidad del usuario.

Enviar todo al servidor introduce un retraso, que puede ser malo o inaceptable en ciertos casos. Al mismo tiempo, mantener todo en el lado del cliente dará lugar a modelos más débiles.

¿Qué grado de precisión tiene el reconocimiento facial?

La precisión no es un término muy bien definido en el reconocimiento facial. La razón principal es que se trata de un problema difuso con todo tipo de entradas confusas (poca luz, cara parcialmente cubierta por el pelo, calidad de la cámara, etc.) e incluso entradas engañosas (¡más sobre esto más adelante!). Como resultado, las redes neuronales que intervienen en el reconocimiento facial deben ajustarse al problema en cuestión, lo que limita su alcance. Así, mientras que un sistema industrial de reconocimiento facial puede presumir de una precisión del 100% (lo que suele ser el caso), el mismo sistema puede no tener ni un 20% de precisión cuando se le pide que identifique caras en una foto llena de gente.

En una investigación, un tipo concreto de algoritmo de reconocimiento facial fue capaz de alcanzar una precisión del 98,52%, superior a la precisión humana del 97,53% lograda en la misma prueba. En otro estudio realizado en medicina forense, la combinación del juicio humano y los algoritmos dio los mejores resultados en algunos casos.

En resumen: para aplicaciones específicas y bien definidas, el reconocimiento facial es la mejor herramienta que tenemos.

¿Dónde se utiliza el reconocimiento facial?

Incluso en el breve periodo en que se han desarrollado algoritmos viables, el reconocimiento facial ha encontrado aplicaciones increíblemente útiles y apasionantes. Algunas de ellas son llamativas, pero otras están tan sutil y fundamentalmente entretejidas en la vida cotidiana que apenas nos detenemos a pensar en lo que hay debajo.

Facebook es quizá el ejemplo más común de los modernos sistemas de reconocimiento facial en funcionamiento. En cuanto usted sube una foto, la red social es capaz de detectar rostros. Mientras que hace algún tiempo se le pedía que etiquetara a sus amigos, ahora Facebook es capaz de hacerlo por sí solo.

Una nueva aplicación interesante de Facebook es la función de informar a los usuarios cuando alguien sube fotos que contienen sus caras, aunque no se les haya etiquetado en ellas.

Snapchat hace un uso intensivo de la detección y el reconocimiento de rostros para muchas de sus funciones, sobre todo los divertidos filtros que hacen furor.

Para que estos filtros funcionen, los contornos y rasgos de la cara del sujeto deben detectarse a la perfección, de lo contrario, las superposiciones no parecerán realistas. Lo mismo ocurre con Face Swap, otra popular función de Snapchat. Si le interesa profundizar en las capacidades de Snapchat en materia de reconocimiento facial, consulte aquí.

Uber lleva tiempo luchando contra los problemas de privacidad y seguridad, y la última arma en el arsenal de la compañía es el reconocimiento facial. La empresa ha puesto en marcha una nueva función en la que se verifica la identidad de sus conductores-socios utilizando sus rostros. La empresa afirma en su blog que tras probar varios proveedores de tecnología de reconocimiento facial, se decantaron por Microsoft Face API por su alta calidad. Curiosamente, esta comprobación de identidad en tiempo real funciona bien en condiciones de poca luz y es capaz de detectar gafas.

Dado que el reconocimiento facial está demostrando su éxito en la naturaleza, es fácil predecir que pronto podría sustituir a otros métodos de identificación en instituciones educativas, hospitales, bibliotecas, etc.

Laprevención de la delincuencia en el comercio minorista es una extensión natural de la aplicación del reconocimiento facial. Se calcula que la industria minorista pierde 45.000 millones de dólares cada año a causa de los ladrones y otros delitos minoristas, con muy poco para contrarrestarlo. Ahora, empresas como FaceFirst están ayudando a los minoristas a utilizar el reconocimiento facial para detectar a los delincuentes anteriores y alertar a los agentes de seguridad.

Lavigilancia policial está empezando a aprovechar el reconocimiento facial como todas las demás instituciones que existen. Por ejemplo, en el Reino Unido, la policía del sur de Gales está utilizando cámaras instaladas en furgonetas para facilitar la vigilancia de las multitudes.

Aunque este nuevo superpoder en manos de la policía ha suscitado acalorados debates públicos sobre la privacidad individual, la policía cree que le ayudará a restringir mejor a los malhechores. Como declaró Richard Lewis, subjefe de la policía de Gales del Sur, al Financial Times:

Si identificas a alguien que ha cometido un delito [previamente], básicamente le dices: sabemos que estás aquí, por favor compórtate.

Laasistencia sanitaria tuvo recientemente una aplicación inesperada, en la que el reconocimiento facial ayudó a detectar un raro trastorno genético llamado síndrome de DiGeorge.

El síndrome de DiGeorge aparece en aproximadamente 1 de cada 6.000 niños y provoca deformidades en varias partes del cuerpo. El problema sanitario, en este caso, es más grave para los países más pobres, que no disponen de recursos para recurrir a costosos métodos de diagnóstico. Por ello, el reconocimiento facial, con una asombrosa precisión del 96,6%, ofrece una nueva esperanza a las víctimas del síndrome de DiGeorge.

En el sector de las aerolíneas, la adopción del reconocimiento facial va en aumento y pronto sustituirá a las tarjetas de embarque convencionales. Actualmente, existen resultados limitados pero prometedores para ayudar a identificar a los pasajeros cuando abandonan el país. De hecho, la Administración de Seguridad en el Transporte (TSA) de EE.UU. ha trazado un plan para el uso generalizado de la biometría basada en el reconocimiento facial.

Usos controvertidos del reconocimiento facial

La tecnología nos da poder, aunque su buen o mal uso depende de nosotros. No cabe duda, pues, de que algo tan potente y radical como el reconocimiento facial se está utilizando de un modo que suscita preocupación por los derechos humanos fundamentales y la ética.

El ejemplo más destacado de usos controvertidos del reconocimiento facial es el enorme sistema de vigilancia de China, que emplea unos 200 millones de cámaras para vigilar a sus 1.400 millones de ciudadanos.

El sistema rastrea a las personas y evalúa sus acciones, actualizando constantemente una métrica llamada puntuación ciudadana. Aunque hay cierto valor en disponer de un potente sistema de vigilancia controlado por el Estado (el seguimiento de los morosos, por ejemplo), la mayoría lo ve como la llegada del futuro distópico que imaginó George Orwell. Es un futuro en el que los gobiernos tienen un poder ilimitado sobre el individuo y la privacidad es inexistente.

El segundo ejemplo del discutible uso del reconocimiento facial también procede (¿no es sorprendente?) de China. Esta vez, el sistema escolar adopta el reconocimiento facial para asegurarse de que los alumnos están «atentos» durante las clases. El nuevo sistema de reconocimiento facial, aunque aún no está muy extendido, sustituye a los carnés de identidad, tarjetas de biblioteca, sistemas de asistencia, etc., utilizando el rostro del estudiante para su identificación.

Pero lo más escalofriante es que este sistema supervisa los niveles de atención de los alumnos, el uso de los teléfonos móviles, etc., y alerta al profesor cuando se supera un determinado umbral.

Aunque la videovigilancia basada en el reconocimiento facial no es exclusiva de China -Estados Unidos se ha esforzado por utilizarla para frenar la violencia armada en las escuelas-, es China la que parece estar llevando esto más lejos que ningún otro país.

Comparación de las API de reconocimiento facial más populares

A la hora de hacer uso del reconocimiento facial, ¿qué opciones tiene? En esta sección, examinaremos lo que es de uso común y cómo se comparan entre sí las distintas soluciones.

Antes de empezar, sin embargo: un recordatorio de que estas API evolucionan rápidamente, y es probable que se encuentre con entradas de blog que digan que esta API carece de esta o aquella característica. No tome sus decisiones basándose en eso. Analice primero las necesidades de su empresa, compruebe detenidamente las características ofrecidas, haga una prueba y, sólo entonces, decídase.

OpenCV

La investigación en IA es un sumidero sin fondo. Entrenar y perfeccionar un sistema de reconocimiento facial es difícil y es mejor dejarlo en manos de conglomerados con bolsillos profundos y un ejército de investigadores. Sin embargo, si sus necesidades son sencillas y le gusta tener el control total -y, por supuesto, está dispuesto a asumir el mantenimiento de un equipo de ingeniería minúsculo/pequeño- OpenCV podría funcionar para usted.

Se trata de una biblioteca de visión por ordenador de código abierto que es extraordinariamente precisa y está disponible para todas las plataformas de programación. Aquí tiene un ejemplo espeluznante de cómo puede poner en marcha un sistema de detección de rostros con Python y OpenCV ¡en 25 líneas de código!

Ahora bien, puede que se encuentre con algunos blogs que dicen que OpenCV no tiene reconocimiento facial. Bueno, es una completa mentira, y aquí está la prueba. En definitiva, OpenCV puede ser una gran elección para su negocio si las necesidades son simples y específicas.

Amazon Rekognition

Rekognition es una oferta muy potente de uno de los mayores proveedores en la nube que existen: AWS. Se trata de un potente servicio totalmente gestionado para la plataforma AWS, y si ya está haciendo uso de AWS para su despliegue, Rekognition es probablemente la mejor opción.

Algunas de las alucinantes características que ofrece Rekognition son:

Análisis en tiempo real (a medida que carga una imagen o un vídeo en S3)
Amplio análisis facial (sexo, color del pelo, expresión facial, ojos abiertos o no, etc.)
Trazado de trayectorias (captura de trayectorias de objetos identificados en vídeos)
Detección de escenas y actividades (interior/exterior, «jugando al fútbol», etc.)
Moderación de contenidos no seguros (desnudos, por ejemplo)

La mayor ventaja de Rekognition es también su mayor inconveniente: le costará mucho utilizarlo con servicios que no sean AWS hasta el punto de tener que renunciar a él.

Kairos

En agudo contraste con Rekognition, Kairos le proporciona la IA a través de una API (la rima es involuntaria, ¡lo juramos!), permitiéndole tomar el control total de sus datos y servidores. Kairos se presenta como un servicio que da prioridad a la privacidad, y es extremadamente crítico con Amazon y otras empresas que colaboran con el gobierno (también lo es ACLU, por cierto).

Kairos funciona tanto con imágenes como con vídeos y tiene todas las características agradables que cabría esperar de una API moderna de reconocimiento facial. Tiene algunas de las asombrosas funciones que se encuentran en Rekognition, pero si no las necesita y ya está gestionando sus datos, ¿para qué molestarse?

Kairos tiene un despliegue on-premise para aquellos que son paranoicos con la privacidad y ni siquiera quieren enviar datos a través del cable para su procesamiento, Kairos tiene despliegue on-premise, el precio depende de su caso de uso y puede ser bastante caro.

Google Cloud Vision

Google ha optado por diferenciar sus servicios de reconocimiento facial para imágenes y vídeos. La API para imágenes se conoce como Cloud Vision, mientras que el servicio centrado en vídeos se llama Video Intelligence.

Mientras que el servicio centrado en la imagen es bastante similar a lo que ofrece AWS, el servicio de vídeo tiene una buena característica de catalogación y búsqueda. Esto será útil para las empresas que tengan grandes archivos de vídeo que quieran analizar o buscar.

Dicho esto, Video Intelligence carece de funciones de reconocimiento facial en el momento de escribir estas líneas, y éstas parecen ofrecerse únicamente en Cloud Vision. El seguimiento de objetos y la detección de texto también están en fase beta, lo que la sitúa muy por detrás de las ofertas de Amazon.

API facial de Azure

Con Microsoft tomándose sus ofertas en la nube más en serio que las de escritorio (por fin), la API Azure Face es una oferta encantadora. Tiene todas las características interesantes que cabría esperar (detección, identificación, agrupación de caras, búsqueda de caras similares, emoción, etc.), y funciona igual de bien con vídeos.

Ahora bien, esto no está estrictamente relacionado con el reconocimiento facial, pero merece la pena mencionar que Azure también ofrece un servicio de visión por ordenador para clientes, que le permite utilizar sus entradas y entrenar modelos según sus necesidades.

Al igual que el servicio de Google, hay un campo de juegos disponible directamente en la página de inicio, ¡lo que hace que probar la API sea muy divertido!

¿Existen diferencias significativas entre los principales servicios de reconocimiento facial gestionados? En realidad, no. Ahora mismo existe una intensa competencia en este campo y las nuevas funciones se lanzan más rápido que las pizzas. Si ya está vinculado a un ecosistema concreto, utilizar su propio servicio de reconocimiento facial tiene sentido. De lo contrario, quizá le convenga elegir otro proveedor si sus necesidades son específicas (controlar sus propios datos, necesitar sólo detección simple, etc.).

Sistemas de reconocimiento anti-facial

Del mismo modo que algunos investigadores han dedicado su vida a perfeccionar la tecnología de reconocimiento facial, otros están ocupados desarrollando técnicas para engañarlos. Uno de estos desarrollos interesantes son las gafas Adversarial, que parecen normales para los seres humanos pero han engañado a los sistemas expertos de reconocimiento facial.

Eso sí, estas gafas aún no están disponibles en el mercado, aunque los investigadores afirman que se pueden imprimir en 3D fácilmente.

Otro avance interesante fue el lanzamiento de las gafas ekō en Kickstarter. Aunque el producto está ahora cancelado, partía de una idea extraordinariamente sencilla: unas gafas de sol normales y corrientes por 45 dólares que simplemente reflejaban la luz, haciendo que las cámaras y los dispositivos de videovigilancia se volvieran locos.

Al igual que en el ámbito de la ciberseguridad, «hackers» e investigadores se enfrentan en la carrera hacia la perfección del reconocimiento facial. En torno a 2014, vimos la popularidad del maquillaje de camuflaje que otorgaba invisibilidad frente al reconocimiento facial, pero ya no es viable. ¿Habrá una encriptación AES del reconocimiento facial? Sólo el tiempo lo dirá

¿El reconocimiento facial es para usted?

El tipo de negocio que puede beneficiarse del reconocimiento facial es aquel en el que intervienen personas -sí, ¡lo que significa todos los negocios ahí fuera! Aunque los usos actuales del reconocimiento facial parecen estar abanderados por los gobiernos, las grandes empresas o las startups tecnológicas, no hay ninguna razón por la que su negocio no pueda beneficiarse de él.

Las posibilidades son realmente infinitas si combinamos un poco de pensamiento creativo: saludar e identificar a los clientes de un hotel, localizar a su amigo en un mar de gente, encontrar a personas con caras similares (quizá para utilizarlas como actores), detectar personalidades para entrevistas de trabajo (de nuevo, aquí sólo estamos dejando volar la imaginación; puede que no haya nada sustancial en un estudio de este tipo), personalizar la experiencia bancaria cuando entra un cliente de gran valor… Hay infinitas formas de utilizar el reconocimiento facial a niveles pequeños y grandes para que su empresa funcione mejor.

Conclusión

Muy pronto el reconocimiento facial estará tan extendido y será tan común que ni siquiera lo notaremos (¿como los teléfonos móviles?). De hecho, los buscadores de reconocimiento facial también están ganando bastante tracción.

Aunque la tecnología subyacente está casi perfeccionada, en el mundo real no se trata sólo de detectar rostros, sino de lo que podemos hacer con esa capacidad.

¿Le parece fascinante y le interesa saber más? Eche un vistazo a este brillante curso sobre Visión por Computador.

Ankush Thakur
Colaborador
- LinkedIn
Escribo sobre, alrededor y para el ecosistema de los desarrolladores. Recomendaciones, tutoriales, debates técnicos… publique lo que publique, hago todo lo posible por cortar la confusión y la vaguedad, y ofrecer respuestas procesables basadas en mi experiencia personal como desarrollador full-stack.