Esto es, sencilla y llanamente, increíble.

  • ¿Y si te dijera que ya existen herramientas de inteligencia artificial que son capaces de traducir todo lo que dices a cualquier otro idioma?
  • ¿Y si te dijera que estas herramientas están al alcance de cualquiera, sin tan siquiera tener que pagar una suscripción mensual?

Acompáñame en este nuevo programa de enCLAVE DIGITAL, porque vas a flipar.

¡Empecemos!

IA idiomas

IAs de traducción automática

Agárrate, que vienen curvas.

Ahora voy a compartir por aquí un vídeo que nos enviaba hace ya unas semanas Ángel, mecenas de la comunidad y un crack en esto del doblaje profesional, por el grupo privado que tenemos en Telegram.

Pero antes, un disclaimer:

  • Si tienes en segundo plano reproduciendo este programa desde la web, desde el canal de Youtube, o desde Spotify, te aconsejo que me dediques aunque solo sea treinta segundos a que veas el siguiente vídeo.
  • Si me estás escuchando desde una aplicación de podcast de solo escucha, no te preocupes, que en cualquier caso voy a explicar, al final del mismo, qué está ocurriendo.

Dicho esto… ¡Dentro vídeo!

[Lo puedes ver en el vídeo que acompaña estas palabras]

Vale, explico por si solo me estás oyendo o no te has dado cuenta.

En el vídeo, Ángel sale hablando, en apenas 28 segundos, primero en un idioma (el suyo), y luego en otro idioma que, como explica en subtítulos, no conoce, y por tanto no es capaz de hablar.

Obviamente, el segundo cacho está creado íntegramente por una IA. En este caso, por HeyGen.

Esto de por sí ya me parece increíble. Si has estado solo escuchando este audio ni te habrás dado cuenta de que era una IA, ya que la voz parece exactamente la misma que la de Ángel.

Pero es que si lo has podido ver, y si no para eso estoy yo aquí narrándotelo, lo más increíble de todo es que su boca mientras hablaba en ese otro idioma se mueve como en principio se debería mover al pronunciar ese lenguaje.

Es decir, que esta herramienta, HeyGen, ya no solo es capaz de hacer que una persona en un vídeo hable en cualquier otro idioma de forma natural, sino que además lo haga moviendo la boca y con los gestos faciales esperables.

El sueño húmedo de cualquier localización en la industria cinematográfica, vamos.

Fíjate que no estamos ante un simple «cambio el sonido por otro idioma y listo», sino ante una modificación del rostro del interlocutor para que el resultado final, a todas luces, parezca totalmente real.

Herramientas de IAs generativas al alcance de cualquiera

Para preparar este vídeo Ángel ha estado usando, como decía, HeyGen, una herramienta de IA profesional que aunque es de pago, incluye una versión gratuita de prueba.

Los resultados son muy creíbles, lo que está sirviendo para que pululen durante estas últimas semanas numerosos memes por Internet de políticos y famosos hablando en idiomas totalmente inverosímiles.

Es más, ha tenido tanto éxito este servicio que los tiempos de espera para que se procese el vídeo han llegado a ser de uno o dos días. Lo que ha llevado a muchos usuarios a utilizar otra herramienta que también ofrece esto mismo, pero sin el retoque de los labios.

Esta otra herramienta se llama Rask.ai, y aunque en efecto es algo peor (porque «solo» modifica tu voz para que hables en cualquier otro idioma, no también el vídeo), si incluye otra serie de funcionalidades, todas asistidas por esa IA generativa, que son la mar de interesantes.

Entre ellas, he estado probando una que transforma un vídeo que le subas en formato reel, perfecto ya para compartir en redes sociales como TikTok, Facebook, Instagram o Youtube Shorts.

  • De nuevo, si me estás viendo en segundo plano, dedícame aunque sea un minuto a mirar a la pantalla.
  • Y si no, tranquilo que te voy a narrar todo lo que está ocurriendo.

[VÍDEO INCRUSTADO]

Hace ya unos días subí de ejemplo un vídeo de unos 7 minutos con una colaboración mía en un programa de televisión. La herramienta procesa el vídeo y te avisa que te enviará una notificación cuando ya tenga generado el contenido en cuestión.

Esto ocurrió en apenas unos cinco minutos, llegándome al correo un mail con un enlace para que entre en la página donde podemos ver una serie de reels creados automáticamente.

Le he quitado el sonido para ir hablando, pero por supuesto, cada vez que le doy a reproducir un reel, además de haber incluido los subtítulos (en el vídeo original no estaban), mantiene el mismo sonido.

La herramienta me da entre cuatro y ocho propuestas generadas por IA. Si hay más de una persona hablando, como de hecho ocurre en esta participación que hice en directo en televisión, corta la imagen para que en todo momento solo se vea a la persona que está hablando.

Y otra cosa que me parece maravillosa es que la imagen que muestra sigue todo movimiento el rostro interlocutor, teniendo así siempre centrada la cara de quien está hablando.

Además, hasta me sugiere una serie de hashtags con los que compartir el vídeo.

Funcionalidad… y también productividad

Todo esto, por supuesto, lo podría hacer yo, o bien Gema, una de las compañeras en CyberBrainers que me suele ayudar con el contenido que publico en redes sociales (edición de algunos de estos podcasts incluida, por cierto). Pero el tema está en la dedicación que tenemos que darle a producir cada pieza.

Para que te hagas una idea:

  • Gema puede tardar de media una hora en prepararme un reel con un vídeo que previamente le he dado.
  • Yo, que suelo ir a mayor ritmo por eso de no tener que pedirle feedback a un tercero, me suele llevar como 20 o 30 minutos.
  • Esta IA lo ha hecho en ¿5 minutos?

Fíjate que me ha llevado más tiempo a mí mirar cada una de las opciones que me ha preparado, que el tiempo de procesado del vídeo por parte de la herramienta.

Algunas de ellas que no me gustan o no ha clavado correctamente.

También es cierto que la calidad es la que es.

  • Pero es que con Gema, supone dedicar una hora de su jornada laboral a esto.
  • Si lo hago yo, tengo que dedicar esa media hora íntegra a montarlo. Media hora que pierdo de hacer otras cosas que me traen beneficio económico directo.
  • Con un servicio como este, que tiene un coste mensual de 10 o 20 euros, tiempo de dedicación propio es de apenas 5 minutos, más lo que tarde la herramienta en procesar el vídeo (que ya te digo que es apenas unos minutos).

Aunque el resultado no sea perfecto aún, es lo suficientemente correcto como para que, de vez en cuando, prefiera pedirle a la herramienta que prepare un vídeo mío que no es muy trascendente, y ahorrarme tanto el tiempo como los recursos asociados de mi día a día, y de los que tiene que destinar Gema, para que produzca contenido para el resto de clientes.

Los avances de la Inteligencia Artificial están ofreciéndonos una posibilidad de oro a la hora de mejorar la productividad de nuestras empresas.

Las IAs no nos van a quitar el trabajo, pero sí van a desplazar a aquellos profesionales que no sepan cómo utilizarlas para ser más productivos.

Charla de Pablo F. Iglesias sobre inteligencia artificial en un evento del sector inmobiliario en Barcelona

De esto va justamente la inteligencia artificial.

Traducciones simultáneas: El futuro ya está aquí

Hace unos días se estuvo debatiendo en el Parlamento Europeo la idea de utilizar el catalán, euskera y gallego como idiomas disponibles en todas las sesiones.

El 17 de agosto de 2023, el Gobierno español solicitó a la Presidencia del Consejo de la UE que iniciara el procedimiento de modificación del Reglamento 1/1958 por el que se determinan las lenguas a utilizar por la UE para incluir el catalán, el vasco y el gallego-español como lenguas oficiales en España, y que están reconocidas como lenguas cooficiales por el artículo 55, apartado 2, del Tratado de Unión Europea.

Petición española en el Parlamento Europeo

Por supuesto, todo lo que sea enriquecer y democratizar el acceso y legibilidad de las sesiones parlamentarias en la UE es bienvenido. Pero recordemos que hoy en día la UE gasta más de mil millones de euros del presupuesto aunual (EN) en ofrecer traducciones simultáneas.

Que sí, que esto solo representa un 1% del presupuesto europeo global. Y que da trabajo a centenares de profesionales.

Pero tenemos que ser conscientes de que conforme se expande el proyecto europeo, hay cada vez mayor reticencia a incluir países con idiomas propios, que supongan, de facto, decenas de millones de euros más invertidos en esta partida solo en el simple hecho de ofrecer un sistema de traducción simultáneo para sus políticos y para todo aquel ciudadano que quiera ver las sesiones desde su hogar.

Si, de pronto, se valorara migrar hacia un sistema automatizado gestionado mediante IA, ese presupuesto de más de mil millones se quedaría seguramente en unas escasas decenas de millones. Y eso siendo muy generoso.

  • Con una calidad de traducción que puede no ser tan sumamente perfecta como la que puede dar un traductor profesional.
  • Perdiéndonos quizás algunos matices en las exposiciones de según qué político…,
  • Pero obteniendo a cambio una voz que sea semejante a la que tiene la persona que está en ese momento exponiendo, y también sin los esperables fallos humanos de interpretación…
  • Con un coste que se reduce dramáticamente, pudiendo, de paso, destinar estos cientos de millones en tareas que quizás sean más productivas para la ciudadanía en general…
  • Con una escalabilidad ilimitada (mayor número de idiomas no significa mayor gasto)
  • Y sin, con ello, desincentivar la entrada de nuevos miembros y nuevos idiomas regionales.

La ruptura de la Torre de Babel

E iría más lejos aún.

¿Por qué el inglés debe ser el idioma principal de la Unión Europea? Antes, cuando Reino Unido formaba parte de la UE, todavía tenía sentido, al ser el Reino Unido uno de los socios fundadores, y sin obviar el peso y la importancia que tiene Estados Unidos en la geopolítica mundial.

Pero, hoy en día, en la UE solo hay, que recuerde, dos países de habla inglesa (y que cuentan también con su propio idioma nativo): Irlanda y Malta.

A sabiendas de esto, te lanzo varias preguntas:

  • ¿Por qué no debería ser, por ejemplo, el francés o el alemán los idiomas principales? ¿Por qué no el español, que recordemos que es el tercer idioma más hablado en todo el mundo?
  • O mejor aún, ¿Por qué no debería poder cada político hablar en su propio idioma nativo, algo que, de seguro, hará que pueda expresarse con mayor fluidez, si ya estamos en el punto de que, cualquiera, con un pinganillo, puede, en tiempo real, recibir en su idioma lo que el interlocutor está diciendo en el suyo?

Te leo en comentarios.

Sobre el videopodcast enCLAVE DIGITAL

enCLAVE DIGITAL es el videopodcast de Pablo F. Iglesias, consultor de presencia digital y reputación online.

Si este contenido te sirve para estar bien informado sobre la actualidad en materia de negocios digitales, reputación y tecnología, te agradecería que le dieras a suscribirte en mi canal de Youtube o en la plataforma de podcasting desde donde me escuchas, le des a Me Gusta, me dejes un comentario o reseña y lo compartas con aquellos a los que les pueda interesar.

¡Seguimos!

Si utilizas otra plataforma de podcasting, busca «enCLAVE DIGITAL« en la app para localizarlo, o visita la página del videopodcast, donde ofrezco enlaces directos a las principales plataformas actuales: