abuela en alexa

(Para Marco Rottigni)
07/07/22

Personalmente, estoy fascinado con la inteligencia artificial, la tecnología y cómo se introduce de forma gradual pero inexorable en nuestras vidas de una manera generalizada.

Mejorándolas, por supuesto, a veces de forma muy disruptiva como... reviviendo emociones relacionadas con personas que ya no están.

En estos casos es importante el pensamiento crítico: ese mismo pensamiento nos lleva a evaluar estos impactos, decidir si queremos ser parte de ellos, sopesando también los posibles aspectos negativos. Esto explica la fascinación que la tecnología tiene sobre mí, como motivo de frecuentes epifanías y momentos catárticos.

Uno de estos momentos me sucedió hace unos días, a raíz del evento re: MARS 2022. Una kermesse sobre inteligencia artificial en la que el gigante Amazon ilustra al mundo sus estudios, experimentos e innovaciones en materia de aprendizaje automático, automatización, robótica y espacio… aplicado a los negocios presentes y futuros.

El evento en sí es fascinante, lleno de ideas y provocaciones, con muchos invitados ilustres, incluso externos. Los discursos de estos invitados, conocidos en la jerga como keynotes, también están disponibles en línea en YouTube para consumo repetido por parte del público.

En el keynote del segundo día disponible en https://www.youtube.com/watch?v=22cb24-sGhg, precisamente después de una hora y dos minutos del inicio, me llamó la atención un pasaje de Rohit Prasad: científico jefe por Alexa IA.

Estaba siguiendo su contextualización, muy bien preparada: hablando de la empatía entre el hombre y la máquina como un sentimiento en la base de construir una relación de confianza, se centró en el hecho de que para muchos de nosotros la reciente emergencia pandémica ha significado la pérdida de un ser querido

Alexa, a menudo un símbolo de esta presencia tecnológica, incluso para conversaciones simples, ha desarrollado habilidades a lo largo del tiempo por las que quedé literalmente atónito: obviamente no como para eliminar el dolor de estas pérdidas, pero suficiente para proporcionar una forma adicional de hacer memoria de las personas. cuidado más persistente.
En cuestión de segundos, el video cambia para mostrar a un niño pidiéndole a Alexa que su abuela fallecida le lea un pasaje del Mago de Oz, tal como lo hizo cuando estaba vivo.

Alexa responde con un "Está bien" a la solicitud, para pasar de inmediato a una simulación perfecta de la voz de la querida abuela, dando una emoción visiblemente tangible al nieto tecnológico.

El video vuelve entonces a Rohit, quien inmediatamente explica dos cosas que me llamaron mucho la atención por su poder innovador: la primera, que la posibilidad que acabamos de ver deriva de un cambio de perspectiva en la forma en que se analiza la voz; más específicamente, trasladar el análisis de un problema de generación de voz, es decir, la producción de una frase de audio, a una cuestión de conversión de voz.

La segunda cosa, muy relacionada con la primera, se refiere a cómo este cambio de perspectiva permitió la reproducción con solo un minuto de grabación de voz existente, en comparación con las horas de grabación en estudio que hubiera requerido el enfoque anterior.

(Rohit Prasad en el escenario de re: MARS 2022)

Pero yo estaba hablando primero sobre la necesidad del pensamiento crítico: más allá del momento guaude hecho, comencé a reflexionar sobre algunos aspectos.

Hay varios servicios en línea, en los que uno de los métodos de autenticación consiste precisamente en pronunciar una oración para demostrar que eres la persona que dices ser: está claro que con esa tecnología, que también está disponible no solo para Amazon, se vuelve importante confiar la fuerza del proceso de autenticación a otros mecanismos, ciertamente menos simulables.

La autenticación biométrica de voz es ciertamente una tecnología joven, que, sin embargo, ha experimentado una popularidad bastante inmediata debido a su facilidad de uso y la ausencia de herramientas accesorias. Gran parte de esta popularidad ha visto a los servicios bancarios y de seguros adoptarla de manera importante, aunque últimamente se combinó con otros mecanismos para aumentar la solidez general del proceso. En un artículo de 2020, se planteó la hipótesis de la combinación de tonos multifrecuencia del teclado de un teléfono como un fuerte proceso de autenticación, combinado con una frase grabada con la voz del cliente que debía reproducirse: no hace falta decir que la innovación presentada por Amazon anularía esa fuerza, poniendo el proceso de autenticación en riesgo de ataques de suplantación de identidad. Ataques que es en los que el atacante dispone de todas las herramientas necesarias para actuar como si fuera la víctima final, engañando al ente tecnológico que debe certificar la identidad.

Otro proceso riesgoso es el que consiste en controlar el acceso, físico o virtual, al trabajo por motivos de tarificación o control de horarios. Otra área en la que los atacantes se verían muy facilitados por estas tecnologías de síntesis de voz.

La segunda reflexión es un poco más emotiva: como decía al principio, esta posibilidad me parece absolutamente fascinante e innovadora; Me doy cuenta, sin embargo, que para diferentes personas esto puede no ser ya una fuente de emociones positivas, sino prolongar el dolor de perder a un ser querido de una manera importante y difícilmente soportable.

Pues bien, si hay algo que distingue al ser humano de la tecnología es la conciencia, de la que se origina el libre albedrío. La historia nos enseña la inutilidad de negar el progreso, la ciencia y la tecnología a favor de sentimientos y creencias personales, correctas o incorrectas. Por eso simplemente recomiendo que estas personas elijan. Optando por ignorar esta posibilidad que ofrece la tecnología, dejando el mismo derecho al resto de los seres humanos.