

Mientras preparaba su Trabajo de Fin de Grado (TFG), Laura dejó de salir. No fue por falta de tiempo, ni siquiera para obligarse a mantener la concentración. Dejó de salir porque le ponía enferma lo que escuchaba en los bares, no entendía cómo nadie se daba cuenta de que aquello no podía ser, que estaba mal. Al principio, regañaba a sus amigas: ¿qué hacían bailando alegremente algo así? Después, directamente optó por irse a casa cuando la frustración resultaba demasiado abrumadora. Y finalmente, cedió: «Tenía que parar de darle vueltas, decidí dejarme llevar como hacían los demás porque me iba a acabar amargando. Es que estaba en todas partes».
Durante la elaboración de su TFG Laura pasó cientos de horas analizando letras de canciones, en busca de mensajes machistas. Y vaya si los encontró. «Escuchaba Carolina, de M-Clan o La raja de tu falda, de Estopa, y no entendía cómo antes no veía las burradas que decían».
Aclaremos, antes de continuar, que Laura Casanovas-Buliart estudió Ingeniería Matemática en Ciencia de Datos en la Universidad Pompeu Fabra (UPF) de Barcelona. Su tesis, hoy un paper viral, consistió en diseñar una inteligencia artificial (IA) capaz de reconocer el sexismo en la música y ponerla a trabajar con una base de datos de más de 2.000 canciones, las más escuchadas en España entre 1960 y 2022, a ver qué encontraba. El resultado le sorprendió: el 51% de las letras analizadas denigraban a la mujer, y desde 2015 ese porcentaje se disparaba al 77%. «Comprobamos los datos varias veces porque nos sorprendía mucho ese pico. ¿Seguro que estaba bien?», recuerda.
Lo estaba, y las causas emergerían al analizar el qué y el cómo.
Para entender cómo una ingeniera terminó denunciando el machismo en la música comercial hay que tener en cuenta un factor decisivo: su madre. Laura siempre concibió la ciencia de datos como una disciplina infrautilizada a nivel social, una tecnología que podía tener un impacto positivo en las vidas de la gente. Hace un par de años, cuando buscaba enfoque para su TFG, empezaba el bum del language processing, que básicamente consistía en enseñar a la IA a leer textos y a analizarlos para poder gestionar grandes bases de datos. Y allí estaba la ingeniera enfrascada en textos legales tratando de encontrar una temática que no fuera demasiado aburrida para entrenar a su máquina cuando su madre soltó, como sueltan las madres las cosas trascendentes mientras hacen cualquier otra cosa: «Toda esa música que escucháis es una mierda, ¿por qué no miras ahí?».
Dicho y hecho.
El primer paso era elegir el contenido a estudiar: serían las canciones más escuchadas en España entre 1960 y 2022. 62 años, nada menos. El inicio no lo escogió Laura al azar: en 1966 se emitió el primer programa de Los 40 Principales, y eso le facilitaba una base de popularidad sobre la que trabajar. Los seis años anteriores elegiría los ‘singles’ más vendidos, y a partir de 2010, sería Spotify quien les proveería de una lista fiable de temas populares. En total, eligió un listado final de 2.840 canciones y descargó las letras de cada una.
Tocaba entrenar a la máquina, y ahí empezó la pesadilla de la ingeniera.
Ver post completo