Cada año nos hacemos siempre la misma pregunta. ¿Una de las dos semifinales de Eurovisión tiene más nivel competitivo que la otra? En este blog analizamos si las semifinales han estado compensadas o no a lo largo del tiempo, así como las implicaciones que tiene.
LAS SEMIFINALES: ASÍ SE REPARTEN
En este blog vamos a analizar si las semifinales de Eurovisión han estado compensadas en cuanto al nivel de las canciones. ¿Alguna vez una semifinal ha tenido mucho más nivel que la otra? ¿Son mejores los resultados de la semifinal 2 que los de la primera?
El reparto de semifinales se hace al azar en función de unos bombos geográficos. De esta forma se evita que ciertos grupos afines caigan todos en la misma semifinal, dándoles ventaja. No es el método más óptimo, pero si en parte eficaz y sencillo. Lo que desde luego no se hace es repartir los países en función del nivel de sus canciones porque muchas ni se conocen en ese instante.
Recuerda que puedes ampliar todas las imágenes haciendo clic en ellas

Esto puede llevar a que en una semifinal se concentren las mejores canciones, al no haberse tenido en cuenta esta variable. No obstante, el nivel de las canciones sí se tiene en cuenta en otros momentos como al elaborar el orden de actuación. ¿Considerará la organización en el futuro repartir de las canciones en las semifinales según su nivel? También hay otro tipo de desequilibrios como que una semifinal tenga voces similares o que caigan todas las baladas juntas.
Pero, ¿cómo podemos saber si una semifinal tiene más nivel competitivo que otra? Esto se puede determinar antes de las semifinales (por ejemplo con algún sondeo y comparando los resultados por los países de cada semifinal) o se puede hacer a posteriori con otras encuestas o los resultados oficiales de Eurovisión. Este último método es el que vamos a utilizar para analizar el nivel de las semifinales desde 2008.
CALCULAMOS EL NIVEL DE LAS SEMIFINALES
El cálculo para determinar el nivel de una semifinal es sencillo. Tomamos los resultados de la final de Eurovisión de cada año y hacemos la media de los puestos de los países en función de su semifinal de origen. Esto nos hace descartar siempre los resultados de los países del Big5 y del anfitrión.
El siguiente gráfico refleja lo que acabamos de decir. Los puntos reflejan el puesto medio de los 10 países clasificados de cada semifinal en la final. En color azul tenemos las medias de la semifinal 1 y en naranja los de la semifinal 2. Por ejemplo, en 2008 los países clasificados de la semifinal 1 quedaron de media en el puesto 10,8 en la final, mientras que los de la segunda semifinal tuvieron una media de 13. Por tanto, los de la semi 1 quedaron en media mejor.

Primero hagamos un análisis un temporal. Se aprecia que no hay ninguna tendencia, ninguna evolución, y que todo se distribuye de forma muy aleatoria. No se observa que los países de una semifinal tengan mejor rendimiento que los de la otra. Por tanto, la semifinal de origen no afecta al resultado final. En los últimos tres años los países de la semifinal 1 han quedado mejor, pero la diferencia es mínima y no significativa.
2019: EL AÑO DEL GRAN DESEQUILIBRIO
¿Cómo de grande han sido las diferencias en cada año? El siguiente gráfico refleja la diferencia, para cada año, de los promedio del gráfico anterior. Es decir, la distancia entre los puntos azules y naranjas para cada año. Además, está ordenado de mayor a menor, no por años.

La mayor diferencia se observa en el año 2019, con hasta 8 puestos de diferencia. Le siguen las semifinales del año anterior en Lisboa 2018. Las semifinales más igualadas según este criterio son la de Viena 2015, dónde la diferencia fue de apenas medio puesto. Por tanto, vemos que hay semifinales más descompensadas que otras.
Como hemos visto, las semifinales más descompensadas fueron las de Eurovisión 2019. El siguiente marcador refleja los resultados finales de aquel año, resaltando en colores la semifinal de origen de cada país. En azul están los de la primera semifinal y en naranja los de la segunda. Sin color están los países del Big5 y el anfitrión.

La diferencia de 8 puestos se hace mucho más visual en este caso. Se observa que el top8 está ocupado solo por países de la segunda semifinal e Italia. El mejor puesto de un país de la segunda semifinal es Australia, que fue octava a pesar de ganar su manga. Además, el peor país clasificado de la segunda semifinal fue 17º, Albania, y quedó por delante de hasta 5 países de la otra semifinal.
Como hemos visto es un caso excepcional. Cabe preguntarse si Lituania, undécima en la segunda semifinal con Jurij Veklenko y Run with the lions se habría clasificado de haber caído en la otra semifinal.
CONSECUENCIAS DE LAS SEMIFINALES DESCOMPENSADAS
¿Y qué ocurre cuando las semifinales están muy descompensadas? Si en una semifinal solo hay buenas canciones y en otra malas, se clasificarán canciones que en global son peores que algunas de las no clasificadas. Esto empeora la calidad de la final puesto que no se clasifican las mejores canciones.
Los grandes perjudicados son aquellos países que, como veíamos con Lituania, probablemente se habrían clasificado con comodidad de haber caído en la semifinal menos competitiva. Además, será probable que alguno de los países que se clasifiquen desde una semifinal con poco nivel obtengan un resultado muy decepcionante en la final.
¿Y a quién beneficia el desequilibrio? Pues los más beneficiados son los países del Big5 y el anfitrión, puesto que se han clasificado países que, en un reparto más justo, no lo habrían conseguido. Por tanto, al bajar el nivel de la edición los clasificados directos ven reducida la competencia y pueden lograr mejores posiciones. Irónicamente, esto no se produjo en 2019 (ver la tabla anterior), donde 4 de los 5 últimos países fueron clasificados directos. Ni con esa pequeña ayuda pudieron remontar.
PARA SABER MÁS… SIMULACIONES PARA SABER CUANDO UNA DIFERENCIA ES SIGNIFICATIVA
En esta parte del blog vamos a ir más allá, nos vamos a poner más técnicos. Puedes seguir leyendo si quieres profundizar más para entender cuando hay una diferencia real entre semifinales.
Las diferencias en el nivel de las semifinales, ¿son significativas? ¿Cómo podemos saberlo? Aunque hay métodos estadísticos, en este caso hemos hecho 1000 simulaciones aleatorias para comprobar cómo de probable es cada resultado, cada diferencia de puestos. Como si tirásemos 1000 veces 2 dados para saber la diferencia entre sus resultados.
El siguiente gráfico es un mix, un diagrama de Pareto. Por un lado las barras son un histograma que nos recoge de forma ordenada la frecuencia de cada suceso. Por otro lado, la línea es una curva que acumula las probabilidades de cada suceso desde el origen. Lo explicamos ahora.

Lo que vemos en las barras es que lo más probable es que solo haya entre 0 y 1 puesto de diferencia entre cada semifinal, le sigue una diferencia de 1 y 2 puestos, 2 y 3 y así sucesivamente.
La línea, como decíamos, recoge la probabilidad acumulada. En la primera barra (0 y 1) vale un 23% porque el 23% de los casos son de una diferencia menor a 1 puesto. En el segundo punto vale un 44% porque es la probabilidad acumulada de que la diferencia sea menor que 2 puestos.
Lo interesante aquí es fijarse en los valores que normalmente se usan en el contraste de hipótesis para determinar cuando algo es significativo o no. Normalmente se suele usar un valor del 95% o del 90% en las ciencias sociales como esta. El 90% en este caso se alcanza para diferencias menores o iguales a 6 puestos. Es decir, todo lo superior se sale de lo (estadísticamente) normal. Por tanto, solo un año (incluso 2 si nos ponemos más estrictos con el corte del 90%) tienen diferencias significativas entre los niveles de competitividad de sus semifinales.
En conclusión solo 1 (ó 2) de los 16 años hemos tenido semifinales desequilibradas. Por tanto, no parece necesario meter mano para distribuirlas mejor, el azar ya hace una buena labor.
LO QUE DE VERDAD IMPORTA: AHORA SOLO CON EL TOP5
En el estudio que hemos hecho, hemos tenido en cuenta las posiciones de los 10 y 10 países que se clasifican de cada semifinal. Alguno puede pensar que quizá los que alcanzan la semifinal por los pelos lo pueden hacer porque tienen que ser 10 o por el efecto vecinal. Es decir, se debería acotar el estudio a aquellos que de verdad tienen nivel en la semifinal.
Para ello, en vez de los 10 países, ahora hemos cogido solo los resultados medios de los 5 y 5 países mejor clasificados de cada semifinal. Por ejemplo, es como si en la primera semifinal del año pasado hubiésemos tenido en cuenta solo los resultados de Croacia, Ucrania, Irlanda, Lituania y Luxemburgo y hubiésemos ignorado los de Chipre, Finlandia, Portugal, Eslovenia y Serbia.
El siguiente gráfico recoge las diferencias teniendo en cuenta solo los 5 mejores países. Además, está ordenado según el tamaño de las diferencias de cada año.

El año 2019 vuelve a ser el que tiene la mayor diferencia, esta vez con 9,2 puestos de distancia. Después hay otras cuatro ediciones con una diferencia superior a 8 puestos, mientras que solo en dos años la diferencia es menor a un puesto.
Las diferencias se han abultado, pero es una consecuencia estadística: si volvemos a hacer 1000 simulaciones, solo son significativas las diferencias superiores a 9 puestos. Por tanto, obtenemos el mismo resultado que en el caso anterior: solo en un año hubo una diferencia significativamente real.
Por suerte, hemos visto que en muy pocos años hemos tenido semifinales descompensadas y que el azar reparte los favoritos de forma equitativa, permitiendo que tengamos finales de un alto rendimiento. Esto perjudica a los clasificados directos, que deben hacer más para conseguir un buen puesto. ¿Pensabas que habría más desequilibrios? ¿Qué semifinales recuerdas que estuvieran más descompensadas? ¿Son equilibradas las de 2025? Veremos cómo se inclina la balanza en Suiza.