Caso de éxito de Prisa Media, empresa socia de la AMDD, por Ana Ormaechea, Chief Digital Officer (CDO) Radios de Prisa Media.
Treinta años más tarde de la irrupción de internet, sumamos un nuevo impacto digital en forma de inteligencia artificial (IA), abriendo nuevos retos, oportunidades y responsabilidades para la industria de los medios de comunicación. Pero, sobre todo, para el ecosistema de la radio y el audio como actores protagonistas.
Los grandes desarrollos de IA aplicados al audio han elevado el uso de la voz hacia cotas inesperadas.
Grandes tecnológicas como Open AI, Amazon, Antropic o Eleven Labs están imponiendo un ritmo trepidante en esta competición “sintética” del audio, permitiendo la clonación de voces con una calidad apenas ya perceptible para el oído humano y al alcance de cualquier ciudadano.
Es esta nueva realidad tecnológica donde surge uno de los mayores desafíos para nuestra sociedad: la proliferación de deepfakes de audio, donde se clona la voz de un personaje célebre para alterar el objetivo de sus palabras y que se utilizan para difundir informaciones erróneas, manipular opiniones o causar daño reputacional.
La velocidad a la que avanza la tecnología de voz con la aplicación de la IA nos obliga, como medios responsables, a trabajar a esa misma velocidad, a aprender el uso y explotación de esta tecnología, y a aplicarla para seguir defendiendo nuestra relación de confianza con nuestros oyentes.
En respuesta a este desafío, surge VerificAudio, una herramienta que hemos desarrollado en Prisa Media para ayudar a nuestras redacciones en Chile, México, Colombia y España a detectar deepfakes de audio.
VerificAudio se elaboró con el entrenamiento de dos motores de inteligencia artificial. Uno es el modelo comparador, tipo transformer, que contrasta las desviaciones del audio sospechoso frente a uno real verificado por el mismo periodista, por lo que el modelo indica la desviación frente al mismo. Y hay un segundo, el identificador, un modelo de machine learning que detecta la manipulación en las cualidades físicas del audio.
De esta manera, en tan solo dos minutos, un periodista puede cotejar un sonido sospechoso en VerificAudio y obtener un porcentaje de verosimilitud de esa voz.