al-pie-de-la-letra-cabecera
Una IA

Si una IA viera el Benidorm Fest: Un análisis computacional de las letras de las canciones

al pie de la letra blog eurovision-spain

Al pie de la letra

Si una IA viera el Benidorm Fest: Un análisis computacional de las letras de las canciones

Escrito por Carlos Valero Mora

04 de enero de 2025


Entradas anteriores

NOTA DEL AUTOR: Para la redacción de esta entrada NO se ha entrenado ninguna red neuronal.

Como un regalo de Navidades anticipado, el pasado 18 de diciembre, RTVE presentó en su web las canciones del Benidorm Fest. Las 18 tratan todo tipo de temáticas aunque, como es de esperar en las canciones de la órbita de Eurovisión, el amor es uno de los temas a los que más se canta.

Ahora bien, a la hora de entender de qué habla una canción (o cualquier texto en general) si nos quedamos solo en el tema, perdemos mucha información, algo así como cuando escuchamos Karnaval de Elvana Gjata y solo sabemos que habla de una fiesta pero no de que «la vida es una fiesta» al más puro estilo María Isabel en La vida solo es una o Azúcar Moreno en Solo se vive una vez. Esto lo sabe muy bien cualquiera que haya empezado a estudiar una lengua extranjera y, al ver a nativos hablando, solo puede entender que hablan del autotune en Eurovisión pero no entiende si están a favor porque «es una forma de modernizar el festival» o en contra porque «es una forma de hacer trampas» (toda similitud con mi experiencia cuando empecé con el noruego durante la introducción del autotune en el MGP es pura casualidad).

Si esto nos pasa a nosotros, seres con un cerebro de carne y una lengua (al menos) ya desarrollada, algo parecido pero peor les pasa a quienes intentan enseñar a las máquinas a entendernos. Para poder llevar a cabo esta obra de ingeniería titánica, la gente que se dedica a ello ha desarrollado multitud de herramientas que desplegaremos durante esta entrada para analizar las temáticas de las canciones del Benidorm Fest de este año al que acabamos de entrar.

¿De qué habla cada canción?: Redes semánticas

Una de las herramientas que tenemos para analizar las temáticas de los textos de una forma un poco más detallada son las bases de datos léxico-conceptuales o redes semánticas. Antes de que os asustéis con el nombre, la idea detrás de estas bases de datos es muy simple: organizar los significados de las palabras del vocabulario de una lengua uniendo las palabras que están relacionadas bajo un mismo concepto. Así pues, palabras como «pena» o «llorar» estarían bajo la categoría de «dolor» que, a su vez, estaría bajo la categoría de «sentimiento». Por su parte «querer» estaría englobada bajo la categoría de «deseo» y, a su vez, bajo la de «sentimiento».

Algunos ejemplos:

Si queremos usar esta herramienta para analizar de qué temas tratan las canciones, la lógica a seguir es simple: buscamos cada palabra dentro de la red, vemos bajo qué conceptos está englobada y tras pasar todas las palabras, vemos qué conceptos se repiten más a lo largo de la canción. Así pues, veamos los resultados:

El caso de Bésame es muy claro: «tacto», «beso» y «ósculo» son los conceptos más repetidos con mucha diferencia. Sin embargo, conceptos relacionados con el fuego son las siguientes palabras más repetidas: «combusión» y «quemar». Sin ver la letra y basándonos en esta lista de conceptos, podríamos arriesgarnos a decir que la canción habla sobre la atracción entre dos personas con metáforas de fuego y, sobre todo, los besos (cosa que, cierto es, ya sabíamos con el título).

Caso parecido al anterior es el de Esa diva, en el que el concepto más repetido, con diferencia, es el de «estrella de ópera» (la red utilizada solo recoge el significado original de diva, no el que le damos actualmente). Sin embargo, no son menos interesantes los otros 4 conceptos que le siguen: herida, daño, influencia y sonido. En este caso la canción sí, habla sobre la vida de una diva pero con sus luces y sus sombras.

En el caso de Hartita de Llorar no hay ningún concepto que sobresalga más que el resto, ahora bien, con los primeros 8 podemos hacernos, de nuevo, una idea de qué temas trata. A «llorar» y «duelo» les siguen «ver», «dejar» y «examinar», cierran el top «golpear», «mal» y «fuerza». En este caso la canción, sí, habla de la tristeza, de ella entendida dentro de una lucha de fuerzas, de ahí que conceptos como «ver», «examinar» y «dejar», estáticas, convivan con otras como «fuerza» o «golpear», dinámicas. También influye en esto el hecho de que sea una canción en la que se hable de la tristeza no provocada por un agente externo, sino entendida como causada, en parte, por uno mismo.

En I’m a Queen vemos que destacan mucho las referencias espaciales: «posición», «ruta», «viaje», «curso» y «movimiento» se repiten más que el concepto bajo el cual englobaríamos el título de la canción, que sería el de «aristócrata femenina». Si no supiéramos nada de la letra sería lógico esperarnos una gran cantidad de metáforas relacionadas con una carrera o un camino para hablar de cómo la cantante es «la queen» que reza el título.

Cuando analizamos La casa vemos de nuevo que los dos primeros conceptos ganan por una gran diferencia al resto: «vivienda» y «línea familiar» son los primeros conceptos de una lista que continúa con «movimiento», «conseguir», «pago», «corregir», «compensar» y «cobrar». En este caso resulta interesante el hecho de que «casa» signifique tanto «vivienda» como «línea familiar» y, para el propósito de la canción viene perfecto, ya que la casa es una metáfora de la vida en común. Si nos guiamos por todas las palabras, podemos deducir que la casa, en la canción, se concibe como una moneda de cambio para zanjar ese proyecto en común que se ha truncado.

Para Reinas destacamos el hecho de que «aristócrata femenina» no aparezca entre los conceptos más repetidos de la canción, como sí pasaba en I’m A Queen. De hecho se repite 3 veces menos que la última palabra que se muestra en la imagen. Es más, es esta última palabra, «reemerger», junto a «reaparecer», la que nos da más información sobre la temática de la canción. Esta canción significa el regreso de Sonia y Selena tras un largo «periodo de tiempo» para «modificar» la situación de las cosas. El resto de conceptos como «ir» y «mover» hacen referencia a algunas metáforas de movimiento que se dan durante la canción y la idea de «montar una fiesta», minetras que «mirar» y «analizar» hacen referencia a la gente que las volverá a mirar a partir de esta canción.

Los significados como números: Embeddings

Uno de los problemas que surgen del método expuesto es que, para que la máquina pueda comprender el significado de una palabra, esta debe haber sido codificada antes manualmente dentro de la red. Si este no ha sido el caso, directamente se obvia o se le asigna otro significado. Es por ello que palabras como «Instagram» en La pena o «stories» en Me gustas tú no se han podido clasificar. Del mismo modo «historias» en La Pena o «diva» en la canción de Melody han sido clasificadas con un significado diferente al que tienen en sus textos.

Para evitar todo este trabajo manual de codificación, desde hace ya unos años los modelos de procesamiento del lenguaje entienden los significados de las palabras de una forma totalmente distinta. Simplificando mucho, la definición de cada palabra es representada por una serie de cientos de números (llamados embeddings o vectores semánticos). ¿Y quién decide cuáles son estos números? Es aquí donde entra en juego lo que se conoce como redes neuronales, las cuales, calculando la posibilidad de aparición de las diferentes palabras en diferentes contextos, van corrigiendo poco a poco los números que representan a cada palabra. De esta manera, las palabras que tienen más posibilidades de aparecer en ciertos contextos, tienen series de números más parecidas.

Volviendo a sobresimplificar, hagamos un ejemplo usando las palabras de las canciones. Si una red neuronal tuviera que representar con embeddings de apenas 3 números los significados de las palabras «mujer», «hombre», «diva», «reina» y «rey» una de las soluciones a las que podría llegar sería usar el primer número para decir el género (0 para masculino y 1 para femenino), el segundo para codificar algo parecido a la realeza (0 para sin realeza y 1 para con realeza). Así pues, de momento, los embeddings que tenemos nos quedarían así:

  • Mujer [1,0,0]
  • Hombre [0,0,0]
  • Reina [1,1,0]
  • Rey [0,1,0]
  • Diva [1,0,0]

Con esta solución tenemos un pequeño problema, la palabra «mujer» y la palabra «diva» tienen la misma serie de números, es decir, el mismo significado. Para solucionarlo, podemos usar el tercer número para codificar la «diveza» y deshacer la ambigüedad. Así ahora nuestro embedding de «diva» pasaría a ser [1,0,1]. De hecho, si interpretamos estas listas de números como coordenadas, podemos representarlas en un gráfico:

A partir de esta lógica a priori simple, podemos hacer algo parecido con las letras de las canciones: tomando un modelo ya existente que tenga la traducción de todas las palabras a números, podremos convertirlas y sacar la media. Con esto tendremos el significado general del texto. Después, comprimiremos las series de 700 números en simplemente 2 y, con ello, podremos graficarlo en un diagrama de puntos como hemos hecho con las palabras. De esta manera, podremos ver qué letras se parecen más o cuáles son más diferentes.

Aún perdiendo muchos matices de significado al reducir 700 números a solo dos, con este método el algoritmo puede agrupar bastante bien las canciones que hablan de temas tristes: No lo ves, Hartita de llorar, Te escribo en el cielo y La pena. Del mismo modo, ha dejado también bastante cerca entre sí las dos canciones de declaración de amor: Loca x ti Me gustas tú.

Por otra parte, si se observa el gráfico en la parte de arriba a la derecha, se han juntado las canciones que muestran a mujeres relativamente fuertes: Esa Diva I’m A Queen como canciones de empoderamiento femenino y Uh nana como canción en la que también, aun siendo de fiesta, la cantante rechaza a un hombre y reivindica su propia independencia.  El grupo de arriba a la izquierda, en cambio, muestra canciones que hablan de rupturas con algún tipo de añoranza, como es el caso de BésameMala feminista.

Si vemos los casos de canciones que se han clasificado de forma independiente, veremos que La casa, aun estando bastante aislada de todas, en el eje horizontal se encuentra a la altura de Uh nana -que, recordemos, es una canción en la que la cantante rechaza a un pretendiente-. Del mismo modo, se encuentra a la misma altura en el eje vertical que las canciones tristes. Por otra parte, el caso de Reinas es curioso porque, aunque sería de esperar que estuviera con el resto de canciones que hablan de empoderamiento femenino, se encuentra sola. Esto tiene sentido si recordamos que Reinas más que de empoderamiento habla sobre el regreso y la nostalgia.

Para rematar, resulta bastante curioso como V.I.P. se ha acabado representando tan lejos del resto de canciones. Como suposición, podría deberse igual al estilo de escritura de la letra, que al estar pensada para un hombre quizá se haya hecho utilizando otra forma de expresarse.

Enseñar a las máquinas a sentir: Análisis del sentimiento

Enseñar a las máquinas a hablar y entender significados, hasta ahora, no se nos ha dado excesivamente mal. Pero, ¿y a sentir? Al final, gran parte de la música es expresar sentimientos. ¿Podríamos hacer que una máquina fuera capaz de entenderlos? Pues, en principio, también tenemos herramientas para ello. Se conocen como algoritmos de análisis del sentimiento y funcionan, en cierta manera, de una forma parecida a los embeddings. A partir de una gran cantidad de frases catalogadas como «positivas» o «negativas», las redes neuronales van aprendiendo qué combinaciones de palabras son más positivas o negativas. A partir de lo que han aprendido, pueden catalogar nuevas frases.

Así pues, al evaluar la positividad o negatividad de cada una de las letras de las canciones, el resultado es el de la imagen: las más negativas con un -1 son Mala feministaLa casa. Por su parte, la más positiva con un +1 es Loca x ti. Todo lo que queda en la mitad izquierda se pueden considerar canciones que se han detectado de sentimientos más negativos; y a la derecha, más positivos.

En esta clasificación resulta extraño a primera vista el caso de Te escribo en el cielo, puesto que, aunque en teoría es una canción triste, puntúa con aproximadamente un +0’5 (por tanto, positiva). La clave está en el tipo de sentimiento que expresa: una pena, sí, pero empapada de nostalgia que hace que esa positividad de los recuerdos bonitos suba su puntuación. En base a este caso salta a la vista que, aunque esta primera aproximación al análisis de sentimientos pueda dar buenos resultados, los sentimientos de las personas son mucho más complejos que simplemente «positivos» o «negativos».

Si una máquina viera el Benidorm Fest, ¿qué entendería?

Una máquina que viera el Benidorm Fest y que estuviera dotada de las herramientas que hemos expuesto, posiblemente se dejaría muchas cosas en el tintero: quizá no entendiera los sentimientos humanos en toda su complejidad o quizá se perdería muchos matices del significado de las canciones. Ahora bien, si compartiéramos sofá con ella a finales de enero, a través de las relaciones inesperadas que trazara (clasificar canciones negativas como Te escribo en el cielo como positivas, ver la nostalgia en canciones como Reinas o encontrar metáforas de viaje en I’m a Queen) podría ayudarnos a entender, aún mejor si cabe, lo que estuviéramos viendo y oyendo.

Conversación

9
TOP
05/01/2025

trabajaco wapo completo enhorabuena