jueves, 24 de julio de 2014

Qué significan cinco sigmas para el descubrimiento del bosón de Higgs


Casi todos los lectores de este blog saben que cuando los indicios sobre la existencia de un bosón de Higgs alcancen cinco sigmas se podrá afirmar que ha sido descubierto. Sin embargo, lo que casi todos ignoran es que la frase anterior, escrita como tal, es mentira. 
Qué significan “cinco sigmas” a secas, nada en absoluto. Hay que clarificar los parámetros de la hipótesis, es decir, en el caso de la existencia del bosón de Higgs hay que especificar en que intervalo de masas se han alcanzado cinco sigmas de significación estadística. 
Este intervalo de masas es diferente en el Tevatrón, que buscó el Higgs en el intervalo entre 100 y 200 GeV, y en el LHC, donde además depende de la energía de las colisiones, ya que a 7 TeV c.m. (año 2011) se buscó el Higgs en el intervalo entre 100 y 600 GeV, mientras que a 8 TeV c.m. (año 2012) se está buscando entre 100 y 800 GeV.
¿Por qué no buscar el Higgs donde creemos que está, digamos entre 115 y 135 GeV? 
Porque desde un punto de vista estadístico se estaría sesgando la búsqueda, con lo que fluctuaciones estadísticas muy probables entre 100 y 800 GeV, parecerían muy excepcionales en un intervalo tan pequeño. Las cinco sigmas de significación estadística deben ser globales si queremos ser rigurosos. Cinco sigmas de significación estadística local solo son del agrado de los blogueros a los que nos encanta propagar rumores con poco fundamento (estadístico, valga la redundancia).
¿Cuál es el intervalo de masas más adecuado para estudiar la hipótesis de la existencia del Higgs? La pregunta del millón de dólares no tiene una respuesta clara. En los anuncios oficiales de la dirección del CERN (así ha sido durante 2011) se ha utilizado el intervalo de masas completo utilizado en la búsqueda (recuerda, entre 100 y 600 GeV en 2011, intervalo que llegará en 2012 hasta los 800 GeV). 
¿Se trata de la decisión más adecuada? No importa, se trata de la decisión más conservadora y la que más información aporta a los físicos, pues cinco sigmas en un intervalo tan grande no solo implica un descubrimiento, sino también la ausencia de otros primos del Higgs (reafirmando de forma indirecta que se trata del único bosón de Higgs predicho por el modelo estándar).
 ¿Por qué no usar en su lugar el mismo intervalo de masas utilizado por el Tevatrón? Pues porque no es necesario. A finales de año, incluso en el intervalo más grande disponible se podrá proclamar un descubrimiento a cinco sigmas, para qué molestarse entonces en reducir dicho intervalo antes de tiempo.
¿Qué significa todo esto en relación al anuncio del próximo miércoles 4 de julio? El anuncio oficial de diciembre de 2011 fue muy pesimista y no llegó ni a dos sigmas de significación estadística global en todo el intervalo entre 110 y 600 GeV para los dos grandes experimentos del CERN (en concreto, 1,5 sigmas en CMS, aunque alcanzó 2,2 sigmas en ATLAS). Si pensamos que es más razonable un intervalo pequeño alrededor de 125 GeV, la significación crece hasta 3,6 sigmas en ATLAS y hasta 2,6 sigmas en CMS. Y si además combinamos estos resultados con los del Tevatrón y los de LEP2, podemos estar hablando de unas 4 sigmas (solo con los datos disponibles a fecha de diciembre de 2011).
 Esto es casi un descubrimiento, por eso muchos blogs y yo mismo creemos que era una señal muy firme del Higgs (aunque dicha señal apunta a un primo del Higgs).
 Por supuesto, esta significación local es muy discutible, pues implica un sesgo (busco donde sé que se encuentra y asumiendo que se encuentra allí). Es mucho más fiable una significación global en todo el intevalo de búsqueda en el que puedo buscar, lo que oficialmente hace la dirección del CERN para no mojarse las manos.
Imagina que el próximo miércoles, 4 de julio, los dos grandes experimentos del LHC, llamados ATLAS y CMS, ofrecen indicios sobre la existencia del Higgs a cuatro sigmas (de confianza estadística para la hipótesis de que el Higgs existe en un intervalo entre 100 y 600 GeV). Combinando ambos indicios se superarán las cinco sigmas, lo que significa que se podría proclamar oficialmente un descubrimiento. ¿La dirección del CERN proclamará un descubrimiento oficial del Higgs? En mi opinión no, no lo harán. Sin realizar la combinación de forma rigurosa, no será utilizada de forma oficial.
¿Deberían combinarse los datos de ATLAS y CMS antes de publicarlos por separado? Quizás sí, es una cuestión de opiniones, pero no se hará. No se hará porque no es necesario hacerlo. En diciembre de 2012, ambos experimentos tendrán indicios sobre el Higgs a más de cinco sigmas y por tanto ambos proclamarán un descubrimiento. La combinación de sus colisiones no se realizará hasta 2013 (quizás no se publique hasta el verano de 2013).
¿Por qué no se acelera todo el proceso? Porque no merece la pena hacerlo. El trabajo teórico de Higgs tiene casi 50 años, el LHC se propuso hace unos 30 años, su diseño y construcción ha costado unos 20 años, y solo llevamos un año y medio tomando datos. ¡Solo 18 meses! La búsqueda del Higgs en el LHC acaba de empezar y confirmar de forma definitiva que se trata de la partícula predicha por el modelo estándar costará unos 20 años.
 ¿Por qué van a tener prisa las autoridades del CERN? ¿A quién le importa lo que algunos digan? Las cosas son así y así seguirán, 
¿por qué han de cambiar?
Como nos cuenta Aidan Randle-Conde, “Why we shouldn’t combine Higgs searches across experiments,” USLHC, Quantum Diaries, June 28th 2012, la razón por la que dos experimentos están buscando el Higgs en el LHC es porque si uno de ellos proclama un descubrimiento, no estará confirmado hasta que otro lo confirme (o lo refute). Por eso, muchos experimentos se diseñan a pares, ATLAS y CMS en el LHC, CDF y DZero en el Tevatrón, UA1 y UA2 en el SPS, Belle y BaBar, etc. Combinar la información de dos experimentos en competencia solo tiene sentido una vez se ha proclamado el descubrimiento por separado en cada uno de ellos. En el Tevatrón nos hemos acostumbrado a que las combinaciones de CDF y DZero se publicaran muy poco después de su publicación por separado, quizás por la presión del LHC, en un intento desesperado por ser los primeros, pero no podemos considerar que esa costumbre excepcional deba ser la regla a seguir; el Tevatrón solo debe ser considerado como la excepción que confirma la regla: solo se combinan los datos de experimentos en competencia mutua cuando ambos han proclamado un descubrimiento. En mi opinión, así se hará en el LHC del CERN.
Lo de siempre, aunque no tenga nada que ver. Que te salgan 5 caras seguidas no significa que la moneda esté trucada y tenga dos caras. Puede que sí, puede que no. Pero que te salgan 50 caras seguidas apunta de forma muy firme a ello. Mirar solo 5 tiradas de 10 monedas da poca información sobre cuáles están trucadas y cuales no; mirar 50 tiradas de una sola moneda da mucha más información sobre si está trucada o no. Pero las sigmas se pueden calcular tanto en un caso como en otro. No es lo mismo 5 sigmas en el primer caso, que 5 sigmas en el otro.
Por todo ello la dirección del CERN prefiere una significación estadística global. ¿Qué harán el próximo miércoles? No creo que cambien de chaqueta en el último momento (como suelen hacer los políticos), sobre todo teniendo en cuenta que en diciembre de 2012 , salvo que ocurra una catástrofe, podrán afirmar que el Higgs existe con una significación global superior a 5 sigmas (y una local cercana a 10 sigmas en algunos canales en el intervalo de 120 a 130 GeV o similar). Por supuesto, ofrezco mi opinión, tan discutible como la de cualquiera.
Mucho hablar de sigmas, pero ¿qué son las sigmas de confianza en la validez de una hipótesis? Nos lo contó Aidan Randle-Conde, “A sigma here, a sigma there…,”Quantum Diaries, 9 May 2012
La palabra “sigma” se refiere a la desviación estándar, denotada por la letra griega del mismo nombre, σ. En el caso más sencillo podemos considerar una distribución gaussiana de probabilidad (también llamada distribución normal). Tomando una con media cero y desviación estándar igual a la unidad, diremos que un dato está desviado más de una sigma de la media si están en la zona rayada de la figura (su módulo es mayor que la unidad). La probabilidad de una fluctuación estadística sea responsable de señal a una sigma es igual a alrededor del 32%. De manera similar la probabilidad de fluctuaciones a dos, tres, cuatro y cinco sigmas más allá de la media es del 5%, 0,3%, 0,005% y 0,00005%, respectivamente.
En los experimentos de física de partículas hay dos fuentes de desviaciones respecto a las predicciones del modelo estándar, por un lado, los errores debidos a fluctuaciones estadísticas y los errores sistemáticos debidos a que calcular las predicciones por ordenador no se puede hacer de forma exacta, y por otro lado, la presencia de una nueva partícula o de una ley física que hace que la Naturaleza difiera de las predicciones teóricas. Para distinguir ambas posibilidades se utiliza el número de sigmas comparado con la probabilidad de que una fluctuación estadística explique dicho resultado. Esta probabilidad depende los parámetros de la hipótesis que se esté estudiando (por ejemplo, el intervalo de masas considerado en el caso del Higgs).
Esta figura muestra la simulación de 100 resultados de una distribución gaussiana junto a la banda de una sigma. Se pueden ver claramente fluctuaciones a dos sigmas de origen puramente estadístico. 
Si en lugar de 100 resultados tuviéramos 1000, habría alguna fluctuación a tres sigmas. Conforme el número de realizaciones del experimento crece, la probabilidad de observar un punto alejado de la media por un gran número de sigmas crece.
En el caso del bosón de Higgs encontrar una fluctuación estadística a tres sigmas en el intervalo de energías entre 100 y 800 GeV es mucho más probable que encontrarla en un intervalo entre 117 y 127 GeV, por ello el número de sigmas se corrige para tener en cuenta el efecto de la longitud del intervalo. Por tanto, si observamos una señal a cinco sigmas locales entre 117 y 127 GeV no significa que tengamos un descubrimiento, ya que dicha señal observada en el intervalo entre 100 y 800 GeV se reduce a menos de cuatro sigmas globales. O lo que es lo mismo, una señal a cinco sigmas globales que permite proclamar un descubrimiento es una señal a más de siete sigmas locales lo que nos hace estar muy seguros de lo que parece que estamos observando realmente está ahí.
Espero haber aclarado un poco este tema (hacerlo de forma rigurosa requiere recordar las técnicas matemáticas de contraste de hipótesis y hoy no quiero ser más matemático de la cuenta).
francis.naukas