Deepfakes: el arte de crear "autores falsos" en la época de la inteligencia artificial

29/12/21

En los últimos años, el desarrollo e implementación de redes neuronales profundas ha acelerado el desarrollo de aplicaciones capaces de reconocer de manera muy confiable diferentes categorías de imágenes y videos. 

Se trata de modelos matemáticos que tienen sus raíces en estudios publicados hace más de medio siglo y que solo en los últimos años, gracias a computadoras de muy alto rendimiento y bajo costo, se han desarrollado rápidamente, permitiendo su aplicación en diferentes contextos reales, como el reconocimiento. de rostros y habla humana.

Una aplicación que está teniendo cierto éxito en el mundo del entretenimiento, pero que plantea varios problemas de seguridad, es la creación de deepfakes, combinación de 'aprendizaje profundo' y 'falso'. Este término hace referencia a cualquier creación obtenida mediante técnicas capaces de superponer imágenes de una persona (target) a las de otra (fuente) en un video en el que la segunda persona hace o dice ciertas cosas. De esta forma se obtienen videos realistas falsos en los que, por ejemplo, un actor hace un papel, pero su rostro se superpone de manera realista al rostro de un personaje famoso que nunca ha pronunciado las frases proclamadas por el actor ni estuvo en el contexto de la escena. De manera más general, con el término deepfakes se refiere a contenidos sintéticos obtenidos a través de herramientas de inteligencia artificial.

Recientemente, algunos artículos han propuesto una descripción general de las técnicas para crear deepfakes y para su identificación. Las técnicas de detección son fundamentales para identificar imágenes y vídeos creados específicamente para desinformar o, de forma más general, para engañar a las personas. En las obras "La creación y detección de deepfakes: una encuesta"1 y "Aprendizaje profundo para la creación y detección de deepfakes: una encuesta"2, los autores explican las tendencias recientes en las tecnologías de fabricación de deepfakes y los posibles usos de buena y mala fe.

Además de los usos lícitos en el ámbito de la producción cinematográfica o en la traducción automática, por ejemplo, existe toda una serie de usos ilícitos, en particular en la producción de películas pornográficas o en la falsificación de discursos, con el fin de ganar dinero fácilmente. influir en la opinión pública y las elecciones, generar pánico, generar pruebas judiciales falsas, etc. 

El primer intento de creación de deepfake se remonta a un usuario de Reddit que desarrolló la aplicación llamada 'FakeApp' utilizando un modelo basado en codificador automático acoplados para extraer los rasgos principales de una imagen facial y reproducirlos en otra imagen facial. 

Un codificador automático es una red neuronal que consta de un codificador y uno descifrador, creado con el propósito de extraer las características principales de un conjunto de datos sin etiquetar (codificador) y reconstruir los datos de entrada (decodificador) a partir de una representación compacta creada previamente. A deepfake se puede crear usando un codificador especializado en la cara de una persona y utilizando la codificación así realizada como datos de entrada para un descifrador especializado en la cara de otra persona.

Una segunda tecnología para producir 'deepfakes' es el uso de 'Redes Adversarias Generativas'. También en este caso estamos ante redes neuronales cuya finalidad es crear imágenes realistas que no se correspondan con personas reales.3.  

El uso de estas tecnologías hace que sea cada vez más difícil distinguir entre una imagen o video real (imagen o discurso) y uno modificado, creando serios problemas en los campos de la privacidad, la vida democrática y la seguridad nacional.  

En estas publicaciones también se hace referencia a algunos casos de especial interés para el mundo militar, en los que se generaron imágenes satelitales modificadas con fines militares, con detalles no presentes en el original.

Si bien es cierto que cada vez es más difícil distinguir las deepfakes De la realidad, también es cierto que la tecnología viene en nuestra ayuda. En sus trabajos, los autores examinan las principales técnicas de análisis utilizadas en la topografía deepfakes, técnicas que a menudo hacen uso, una vez más, de tecnologías de deep learning. Desafortunadamente, sin embargo, estas técnicas de detección son muy vulnerables y un esfuerzo moderado es suficiente para modificar el proceso de creación. deepfakes para que estos ya no sean reconocibles como tales.

Hoy en día, en muchos casos, se utilizan imágenes de video en juicios penales, videos certificados por peritos forenses.

Pero, ¿cuánto puedes confiar en lo que ves o escuchas en un video?

Cada vez menos ... por eso será cada vez más necesario apoyar a los expertos en TI (forense digital) capaz de emplear y reconocer el uso de deep learning a expertos forenses. Desafortunadamente, incluso al hacerlo, en algunos casos el resultado puede no ser suficiente para determinar la verdad, ya que no siempre es fácil o posible explicar cómo funciona una tecnología. deep learning producir o localizar deepfakes

Por tanto, es necesario combinar técnicas y metodologías de inteligencia para la verificación comparativa del contexto con las herramientas tecnológicas de análisis de imagen y video.

Alessandro Rugolo, Giorgio Giacinto, Maurizio d'Amato

Para obtener más información:

- La creación y detección de deepfakes: una encuesta (arxiv.org

[1909.11573] Aprendizaje profundo para la creación y detección de deepfakes: una encuesta (arxiv.org)

El arma más nueva habilitada por IA: Fotos de la Tierra 'profundamente falsas' | Reloj de invierno

El arma más nueva habilitada por IA: Fotos de la Tierra 'profundamente falsas' - Defense One

Creación y entrenamiento de codificadores automáticos falsos profundos - CodeProject

Modelos de redes neuronales recurrentes de codificador-decodificador para traducción automática neuronal (machinelearningmastery.com)

Los generadores de caras falsas de IA se pueden rebobinar para revelar las caras reales con las que entrenaron | Revisión de tecnología del MIT

Comprensión de las redes generativas de confrontación (GAN) | de Joseph Rocca | Hacia la ciencia de datos

[1406.2661] Redes generativas de confrontación (arxiv.org)

1 Yisroel Mirsky y Wenke Lee. 2021. La creación y detección de deepfakes: una encuesta. Computación ACM. Surv. 54, 1, artículo 7 (enero de 2022), 41 páginas. DOI:https://doi.org/10.1145/3425780

2 Nguyen, TT, Nguyen, QVH, Nguyen, CM, Nguyen, D., Thanh Nguyen, D. y Nahavandi, S., "Deep Learning for Deepfakes Creation and Detection: A Survey", arXiv e-prints, 2021, https://arxiv.org/abs/1909.11573v3

3 Un ejemplo de rostros creados con esta metodología está disponible aquí: https://thispersondoesnotexist.com (foto de apertura)