transcripciones audios whatsapp

Este es una de las newsletters antiguas que se enviaron de forma exclusiva a los miembros del Club Negocios Seguros, y que se liberan públicamente un mes más tarde.

Si quieres recibir las actuales cada martes y jueves en tu bandeja de correo, hazte miembro ahora.

*******

Negocios Seguros

Newsletter 914

******

Sigo teniendo una relación de amor-odio con los mensajes de audio.

Algo que he recordado otra vez el otro día, cuando una cliente me envió un audio de whatsapp de más de nueve minutos.

NUEVE.MINUTOS.

Como le dije (también en audio, por supuesto, que a estas alturas ya no me corto), «con suerte» lo escucharía entero y a trozos, ya que como me suponía, todo lo que me dijo eran repeticiones iteradas de la misma información una y otra vez.

Que eso mismo, si me lo hubiera escrito, no hubiera ocupado más de un par de párrafos.

Pero claro, nos ponemos a hablar, y nos quedamos solos. Pensamos que algo no se ha entendido, y volvemos a repetirlo pero con otras palabras, como para darle más énfasis.

Y, al final, te encuentras con un audio de varios minutos que el receptor se va a tener que comer, donde casi todo lo dicho sobra.

La chica esta, yo, y también tú.

En esto pecamos todos.

Audios sí, audios no

Revisando la hemeroteca, me encuentro este artículo de 2021 en el que hablo de otro artículo de nada menos que del 2014 en el que ya doy pestes (y cariño) a la idea de enviar información por audio.

Me parafraseo, que ya sabes que me gusta mucho hacerlo (y total, para qué repetir lo mismo que ya dije en su día en texto, con lo cara que está la letra impresa en pantalla…):

La mayor parte de llamadas telefónicas que recibimos hoy en día son del tipo 4 (no importante y no urgente), pero por el simple hecho de recibirlas por un canal tan invasivo como es el de las llamadas telefónicas (un canal asíncrono que requiere que dejemos de hacer lo que sea que estábamos haciendo y contestemos) pasan a ser de tipo 3 (no importantes y urgentes).

Con los mensajes de voz mantenemos la comodidad esperable de una llamada telefónica, pero sin pervertir la sensación de urgencia, y dando por tanto el control de la recepción y respuesta a nuestro interlocutor.

Hasta aquí, todo correcto.

El problema es que el sonido, por sus propias particularidades, requiere de un compromiso extra por parte del receptor.

Y por varios motivos, de hecho:

  • Un mensaje de texto es más costoso crearlo, y por ende, fuerza al emisor a sintetizar la información lo máximo posible. A informar más con menos. Lo cual en cualquier proceso de comunicación es claramente un punto positivo.
  • Para colmo el sonido requiere para consumirse una serie de particularidades específicas. Un mensaje de texto lo puedes leer en prácticamente cualquier situación (menos cuando conduces diría yo…), y sin embargo para escuchar algo tienes que poder escuchar en ese momento algo, es decir, tener la capacidad de recibir información por el canal auditivo, lo cual no es posible en muchas más ocasiones (estás reunido, en una oficina, ya estás escuchando otra cosa…).
  • Por último, el sonido molesta al resto de potenciales personas que estén a nuestro alrededorUn mensaje de texto no molesta, o al menos no molesta tanto como lo haría un mensaje de voz (si estás manteniendo una conversación presencial con otra persona y continuamente revisas tu teléfono para leer lo que sea que te están enviando es de por sí molesto, pero más lo sería si cada poco le pidieras que se callase para escuchar algo).

Así, es normal que como le pasaba a esta pobre persona extranjera con la que me crucé en aquel transporte público hace años, y como seguramente vemos todos y cada uno de nosotros en el día a día, los mensajes de voz en servicios de mensajería instantánea se han vuelto tan habituales que han generado dinámicas absurdas que contravienen lo que se ha venido a llamar esa nueva etiqueta social del consumo tecnológico.

Y sin embargo…

Tengo que reconocer que un servidor los usa cada vez más.

Mal que me pese reconocerlo, pero es que sigue siendo una herramienta perfecta de cara al emisor.

  • Es mucho más cómoda de llevar a cabo.
  • Es más rápida (generalmente).
  • Evita potenciales malinterpretaciones.

El problema radica en que para el receptor, como decía, puede ser de lo más molesto e intrusivo.

Es, a todas luces, un sistema de comunicación egoísta.

Como si le dijeras a la otra persona que tu tiempo vale más que el suyo.

Yo te fuerzo a que me escuches, sin capacidad de réplica, teniendo que parar lo que estés haciendo en ese momento, y además comiéndote, de paso, mucho relleno.

Por contra, el mayor coste de crear contenido en texto nos fuerza, como emisores, a ser más escuetos. A ir al grano. Y a ofrecer un sistema realmente bidireccional y asíncrono.

Porque esa es otra…

Un mensaje de texto puedes previsualizarlo, para asegurarte que no es urgente (nunca lo es, pero bueno), y ya responderlo más adelante, cuando toque.

Un audio no.

Ahí te va a quedar la notificación… y lo que es peor, la incertidumbre de lo que contendrá, hasta que lo abras.

¿Que puedes ponerlo a más velocidad?

En efecto. Y sí, es una alegría (yo, por ejemplo, escucho por defecto todos los audios que me enviáis a 1,5x), pero es que a mayor velocidad, más necesitas estar concentrado en escucharlo.

Es decir, qué más tienes que parar lo que estuvieras haciendo, y dedicar esfuerzos en comprender la información que te está enviando el emisor.

O, al menos, eso era así hasta ahora.

Transcripciones para todos

En algunos servicios de mensajería como Slack, que es lo que usamos en CyberBrainers para estar en contacto todo el equipo, la herramienta lleva ya unos ¿años? ofreciendo transcripciones automáticas de los audios que se envíen en los chats.

No son perfectas, por supuesto, pero ofrecen justo eso de lo que me quejaba en el apartado anterior: una herramienta al receptor para que pueda salvaguardar su tiempo.

Recibes un audio, pero puedes decidir escucharlo, o simplemente revisar la transcripción para quedarte con la información importante.

Sin tener que parar lo que haces. Sin tener que ponerte los cascos o buscar un sitio donde poder escucharlo sin molestar al resto.

Sin intervenir en tu flujo de trabajo, vaya.

Las transcripciones son una herramienta que transforma un sistema de comunicación egoísta en uno democrático. Es la IA quien hace el trabajo duro de transformar la información en texto, esto es, en un canal estructurado, y aunque lo perfecto sería que ese trabajo de síntesis lo hiciera uno mismo, pues mira, mejor eso que nada.

Todo esto para contarte que, en efecto, y según algunos dataminers, todo apunta a que WhatsApp estaría a puntito de sacar esta funcionalidad en su aplicación (EN).

Yo, sinceramente, estoy aplaudiendo con las orejas.

Como receptor, pero también como emisor de audios.

Que ojalá el día de mañana estos sistemas de transcripción, además de trascribir, nos sinteticen.

Eso ya sería el no va más.

O ya puestos, que trabajen por nosotros respondiendo los audios de las IAs de nuestros amigos, clientes y familiares.

Para poder desterrar el Whatsapp de nuestros móviles y dedicar el tiempo a cosas más productivas, como puede ser ver vídeos chorras en TikTok.

________

Si quieres recibir contenido exclusivo como éste el día uno y directamente en tu bandeja de correo cada martes y jueves, hazte miembro del Club «NEGOCIOS SEGUROS».

Banner negocios seguros