Intentando descifrar los algoritmos para la recomendación en el podcasting

Lourdes Moreno Cazalla
6 min readMar 26, 2023

El proceso de industralización experimentado por el podcasting está ligado a las plataformas de streaming de audio (Apple Podcast, Spotify, a las que se suman Amazon Music, Ivoox y Google Podcast) y para el descubrimiento y consumo de los podcasts se hace imprescindible plantear cuáles son los elementos o características necesarios para aparecer en rankings y potenciar la detectabilidad en cada servicio, un sistema sustentado en los algoritmos. Aunque las redes sociales, otros podcasters y el boca a boca siguen siendo muy eficaces, casi el 49% de los encuestados en el Estudio colaborativo para conocer a la audiencia de podcast en español admite que descubren nuevos podcast a través de la plataformas. Pero, ¿cómo funciona este sistema?

Fuente: Estudio colaborativo para conocer a la audiencia de podcast en español (2022)

Curiosamente leo y escucho mucho esto del “algoritmo”, en singular, como si fuese uno, antropomórfico y omnisciente. En plena pandemia decidí embarcarme en el estudio de los algoritmos y el “machine learning” para comprender cómo afectan a los contenidos y productos digitales es nuevo sistema de distribución — y desde ya quiero dejar claro que dejé el curso en cuanto llegué a las funciones de parámetros, tendré que dejar la ingeniería para otra vida —, porque intentamos simplicar el hecho que cada plataforma tiene numerosos algoritmos diseñados con diferentes funciones y casos, desde las reproducciones u oyentes a calificaciones, reseñas y comentarios o suscripciones, por ejemplo. ¿Esto es cierto?

Un algoritmo es un conjunto ordenado de instrucciones, pasos o procesos que permiten desarrollar una tarea determinada. Se trata de instrucciones preestablecidas que guían las decisiones de una “máquina” o sistema, siendo la base que hace funcionar cualquier sistema de inteligencia artificial y los principales servicios de streaming de audio tienen sus propios procesos y funciones programadas para la recomendación. A pesar del poco conocimiento disponible sobre cómo funcionan los motores de descubrimiento y sobre datos reales auditados sobre el consumo de podcasts, ha surgido toda una subindustria de aficionados, consultores y estrategas de marketing para ofrecer “recetas” o consejos para ayudar a los podcasters a destacar sus contenidos (redes sociales, audiograms, SEO,…), lo que Jeremy Wade Morris ha denominado las “infraestructuras de descubrimiento”.

Volviendo a la ingeniería de audibilidad y visibilidad, y centrándonos en el algoritmo de Apple Podcast, oficialmente se mantiene en secreto cómo se construyen sus rankings y recomendaciones, aunque Chartable publicaba que el posicionamiento se realiza en función de: ESCUCHAS (indicador de la popularidad del contenido) + SEGUIMIENTO (indicador de su intención de escuchar) + TASA DE FINALIZACIÓN DE LOS EPISODIOS (indicador de la calidad del contenido).

Podría decirse que, si bien Spotify amenaza en liderazgo de Apple Podcasts, esta sí que mantiene un papel dominante en la mediación del descubrimiento y consumo de podcasts, puesto que sus listas de los más valorados sirven como herramienta para otras aplicaciones y servicios como Podcharts, Castbox o Podcast Addict, y también se pueden revisar cuáles son los programas más populares en Amazon Music y el porcentaje de correspondencia con Apple. En este sentido destacan las investigaciones de Dan Misener de Pacific Content, considerando que el algoritmo de Apple valora la actualidad y el “hotness” o el análisis de Libsyn, que estima que el factor de clasificación más importante utilizado por el algoritmo Apple Podcast es la cantidad de nuevos suscriptores y su tasa de crecimiento, en los últimos 7 días, con un promedio ponderado de las últimas 24, 48 y 72 horas. Las calificaciones y reseñas no jugarían un papel directo en el Top 200, pero sí que suponen un indicador de que el programa tiene una audiencia real y comprometida.

¿Estará influyendo estas funciones de audiencia comprometida en los sistemas de Ivoox o de Spotify? Recientemente en esta última plataforma se ha incluido la funcionalidad de los comentarios y la posibilidad de realizar encuestas a los oyentes, tendremos que esperar para ver. Ivoox tiene un ranking semanal en el que muestra los más escuchados y en ellos sobresalen muchos programas de radio, una audiencia masiva con la que es difícil competir en volumen con programas de nicho.

En lo que se refiere a Spotify, Tony Jebara, su vicepresidente de ingeniería y jefe de machine learning, admitió en TensorFlow World 2019 que “El aprendizaje automático está en el corazón de todo lo que hacemos en Spotify”. Así que analizando los pocos enfoques publicados se deduce que la recomendación de podcasts están diseñadas para aumentar su “satisfacción general con el producto, lo que lo hace volver a escuchar más y más a menudo” y suelen:

Word Cloud of All Genres. Fuente: GitHub MIT

Aquí podría destacarse la investigación de Dan Misener, quien en el verano de 2022 realizó su propio estudio sobre la recomendación de episodios en Spotify basándose en la recursión, es decir, analizando todos los episodios recomendados y buscando más recomendaciones a partir de ahí y sucesivamente hasta que no encontrar más episodios recomendados y llegó a la conclusión, por ejemplo, de que “El 14% de los episodios recomendados son originales y exclusivos de Spotify”. En este sentido, el informe Canadian Podcast Listener 2022, el descubrimiento un 5% de los oyentes mensuales de podcasts descubren un nuevo programa por primera vez por “la recomendación en función de otros podcasts que escucho”En este caso tu probabilidad de descubrimiento en el Top 200 programas entre 0,02 y 0,9. Según otros análisis, el factor de actualidad premia la relevancia de los podcasts en los charts y así, un podcast que ya tiene más oyentes, o los que tienen más episodios o los que han sido publicados como máximo hace 14 días funcionan mejor ( Maryam Aziz, Alice Wang, Aasish Pappu, Hugues Bouchard,Yu Zhao, Benjamin Carterette and Mounia Lalmas).

Fuente: Leveraging Semantic Information to Facilitate the Discovery of Underserved Podcasts (2022)

Todos estos datos y publicaciones los leemos con distancia y tomados con pinzas porque no hay datos publicados y contrastados. En mi opinión, algunos algoritmos son mucho más holísticos y sensibles a elementos contextuales y por ejemplo, el comportamiento del programa en comparación con podcasts en la misma categoría y su audiencia natural o si el presentador ya tenía una audiencia antes de comenzar su podcast que podría aprovechar para impulsar el crecimiento de su audiencia,… Y es por ello que en muchas ocasiones, el mismo programa tiene un recorrido diferente según las plataformas.

Probablemente las principales plataformas no publicarán nunca sus fórmulas mágicas, no obstante siempre nos quedará el sentido común y los aprendizajes de los ninjas de los podcasts.

“La era de los datos es también la era de la incertidumbre. Cuanto más nos empeñamos en medirlo todo, más nos preocupa lo imprevisible” — Marta García Aller

--

--

Lourdes Moreno Cazalla

Humanista. Intransitiva. PhD en Comunicación. Productora ejecutiva, Distribución y Audiencias en Podium Podcast. Observatorio Nebrija del Español 🎧