El problema Clay del Milenio del “salto de masa” en las teorías cuánticas de Yang-Mills es un ejemplo claro de que los físicos y los matemáticos no se entienden entre sí, salvo en contadas excepciones. Los físicos desean realizar cálculos para comparar las predicciones de la teoría en los experimentos, aceptando desarrollos matemáticos “formales” que parecen repletos de agujeros a ojos del matemático, acostumbrado al rigor como sustituto del entendimiento. Los físicos creemos entender las leyes de la Naturaleza, pero más que entenderlas las intuimos; conforme un físico madura se va acostumbrando a trabajar con estas leyes y va creyendo que las entiende, actuando como si fueran lo más obvio del mundo. Pero en el fondo, todo físico sabe que no sabe nada (nociones tan básicas como qué es el tiempo, el espacio, la energía, etc., son hoy tan “oscuras” como hace unos siglos). Yo creo acertado decir que “en física uno no entiende las cosas, se acostumbra a ellas” (frase basada en la de John von Neumann: “Joven, en matemáticas uno no entiende las cosas, se acostumbra a ellas,” que se supone que respondió a Felix T. Smith cuando dijo que “Me temo que no entiendo el método de las características” [WikiQuote]).
Todo esto viene a cuento por la entrada de ayer. Hace unas semanas me pidieron que hablara de la formulación del problema del salto de masa en teorías de Yang-Mills usando un lenguaje matemático. Mañana me meteré en camisa de once varas y trataré de satisfacerles. Pero antes creo necesario recordar a los matemáticos (y a todos los demás) algunos conceptos básicos sobre teoría de campos, tanto clásicas como cuánticas. Me parece que sin estos conceptos será muy difícil que los matemáticos entiendan bien la entrada de mañana. Por supuesto, para entender bien lo que sigue es necesario estudiar un curso de teoría de campos; mi intención es solo presentar (o recordar) las ideas clave para la entrada de mañana, que estará repleta de matemáticas.
Los campos de Yang-Mills son versiones no lineales del campo electromagnético de Maxwell, por ello conviene recordar algunas cosas sobre teoría clásica de campos que en principio son bien conocidas. Matemáticamente, un campo es una función de una o varias componentes con un valor asociado a cada punto del espaciotiempo. Por ejemplo, al aire de la habitación en la que estás se mueve y podemos asignarle un campo de velocidad (o viento si prefieres), un vector que en cada punto indica la velocidad del aire. Este campo es efectivo, pues lo que se mueven son pequeños volúmenes de aire con un número suficientemente grande de moléculas como para utilizar una aproximación continua. No tiene sentido decir que cada punto tiene un vector asociado, pero es una buena aproximación macroscópica. Lo mismo pasa con el campo de temperaturas de tu habitación. Pero hay campos que creemos que se pueden asignar a cada punto del espaciotiempo, como el campo magnético producido por un imán o el campo gravitatorio que hace caer los objetos a tu alrededor. En física se usan campos escalares, vectoriales, espinoriales, tensoriales, tanto reales como complejos, en función de cómo se agrupen las componentes del campo en cada punto del espaciotiempo.
La teoría de la relatividad exige que los campos se transformen de tal forma que las medidas de magnitudes físicas asociadas al campo sean compatibles entre sí para cualquier par de observadores que se mueven a velocidad constante, es decir, cuando sus sistemas de referencia inerciales están relacionados entre sí por una transformación de Lorentz o una traslación en el espaciotiempo (llamadas en conjunto transformaciones de Poincaré). Por ello, las matemáticas exigen que las componentes de los campos se transformen como componentes de “vectores” en una representación lineal del grupo de Poincaré; en estas representaciones lineales, las transformaciones (geométricas) de Poincaré se “representan” mediante matrices con la dimensión adecuada según el número de componentes del campo. He puesto “vectores” entre comillas para indicar que son elementos de un espacio vectorial (no solo lo son los vectores, también los escalares, espinores, tensores, etc.). El espín asociado al campo caracteriza el número de componentes del campo en una representación del grupo de Poincaré. A los campos con espín cero se les llama escalares, vectoriales a los que tienen espín uno, espinoriales a los que tienen espín un medio, etc. Quizás conviene recordar que el espín no tiene nada que ver con ningún giro, rotación o similar; recibe este nombre por una cuestión histórica, ya que las trayectorias de electrones en un campo magnético se curvaban, giraban, en un sentido u otro en función del espín en el experimento de Stern y Gerlach. El espín tiene las mismas unidades que el momento angular porque en ambos casos se trata de magnitudes cuyo origen es la necesidad de usar una representación lineal de un grupo continuo de simetrías (que en el caso del momento angular son las rotaciones en el espacio tridimensional).
Las ecuaciones de Maxwell se pueden escribir tanto utilizando los campos (eléctrico y magnético), como los llamados potenciales (escalar y vectorial). La gran diferencia entre los campos y los potenciales es que estos últimos contienen información redundante, es decir, más información de la necesaria para especificar de forma unívoca los campos. Por ejemplo, el valor del potencial escalar está indeterminado respecto a una constante y solo tiene sentido hablar de diferencias de potencial (lo que mide un voltímetro). Los matemáticos describen esta redundancia mediante simetrías “internas” (que reciben este nombre porque no son simetrías del espaciotiempo sino de las componentes del potencial del campo). La física (los valores medibles de los campos) no cambian cuando se aplican estas simetrías “internas” a las componentes de los potenciales. Estas simetrías se llaman transformaciones gauge (por analogía con las diferencias de potencial eléctrico) y se llama invarianza gauge de la teoría al hecho de que la física descrita no depende del gauge utilizado. Las simetrías gauge se describen mediante la teoría de grupos continuos (compactos) o grupos de Lie.
Los vectores tridimensionales que representan el campo eléctrico y el magnético no tienen las mismas propiedades, unos son vectores polares y los otros son vectores axiales (la diferencia es similar a la que hay entre la velocidad lineal y la velocidad angular, o entre un vector y el resultado del producto vectorial de dos vectores). Para unificar el campo electromagnético en una única entidad no se puede utilizar un vector hexadimensional ya que se destruiría esta diferencia. Hay que utilizar un objeto más complicado, un tensor antisimétrico de rango dos (una matriz de cuatro por cuatro de diagonal nula). Los potenciales también se pueden unificar en un único vector de cuatro componentes, así como las fuentes del campo, la densidad de carga y la de corriente eléctrica. Haciéndolo de esta forma, las cuatro ecuaciones de Maxwell se pueden escribir como una única ecuación (las dos ecuaciones de Maxwell sin fuentes se cumplen de forma automática y las dos ecuaciones con fuentes se reducen a una única ecuación). El objetivo de esta identificación entre los dos vectores del campo y un tensor antisimétrico no es solo ahorrar letras (y complicarle la vida a los ingenieros), sino entender lo que significa la unificación del campo electromagnético.
Una cuestión epistemológica (o metafísica) importante es qué es más fundamental, los campos o los potenciales. En la teoría clásica se pueden utilizar tanto los campos como los potenciales y como los campos requieren seis componentes en cada punto del espaciotiempo, pero los potenciales solo requieren cuatro componentes, podría parecer obvio que son más fundamentales los potenciales. De hecho, especificar las cuatro componentes de los potenciales permite determinar de forma única las seis componentes de los campos. Sin embargo, el asunto no es tan sencillo, pues hemos dicho más arriba que los potenciales contienen información redundante (la invarianza gauge). Los campos no determinan de forma única los potenciales. De hecho, los potenciales se comportan como si una de sus cuatro componentes sobrara y solo hubiera tres componentes realmente independientes. Se puede imponer una condición (fijar un gauge concreto) que elimine dicha componente, pero no existe ninguna razón física para preferir una manera de hacerlo a cualquier otra (a veces un gauge concreto simplifica ciertos cálculos pero complica otros y viceversa). La simetría gauge de los potenciales parece una propiedad intrínseca de nuestra manera de entender la Naturaleza.
Hasta ahora solo he hablado de teorías clásicas de campos. Para cuantizar el electromagnetismo, en lugar de cuantizar directamente los campos (seis componentes), conviene cuantizar los potenciales del campo (cuatro componentes, aunque una de ellas es redundante). Las ecuaciones de Maxwell equivalen a una ecuación de onda lineal para los potenciales del campo, cuyas soluciones pertenecen a un espacio vectorial de dimensión infinita con un producto interior, es decir, un espacio de Hilbert (he obviado sutilezas como la completitud del espacio garantizada por la teoría de Sturm-Liouville). Gracias a ello, la cuantización del campo es directa y no reviste ninguna dificultad (de hecho ya se hizo en 1926, cuando Heinserberg, Born y Jordan introdujeron el fotón). La información redundante de los potenciales en la teoría clásica, la invarianza gauge, es heredada en la versión cuántica de la teoría. En la actualidad se cree que esta propiedad es tan importante que se puede darle la vuelta al argumento y considerarla como la propiedad que caracteriza a la teoría. El grupo de simetría gauge del electromagnetismo es el grupo de Lie U(1) y se puede demostrar que toda teoría de campos invariante ante este grupo coincide con el electromagnetismo. Muchos físicos afirman que la simetría determina el campo y sus ecuaciones. Obviamente, nadie entiende por qué la simetría de las redundancias en la especificación del campo mediante los potenciales es algo tan fundamental desde el punto de vista epistemológico. Pero a día de hoy, decir teoría gauge es sinónimo de teoría cuántica de campos.
La diferencia entre una teoría clásica de campos y una teoría cuántica de campos es que en la segunda las excitaciones localizadas del campo están cuantizadas, es decir, se pueden contar. Al integrar la energía o el momento en un pequeño volumen del campo, la física cuántica nos dice cuántas de estas excitaciones, ondas, fluctuaciones, rizos (ripples en inglés) hay en dicho volumen. Cada “excitación” tiene una energía y un momento dados (el momento determina la velocidad de la excitación, que en las partículas sin masa es proporcional a la energía pues éstas se mueven a la velocidad de la luz). Puede haber una, dos, tres, …, o cualquier número natural, incluso cero, pero no puede haber media excitación, o un tercio, o dos tercios, o cualquier otro número real. Cuando estas excitaciones cumplen la ecuación de Einstein E=m c², son excitaciones on-shell (“cumplidoras”) decimos que son las partículas del campo (en el caso del electromagnetismo son los fotones, que al ser partículas sin masa cumplen E=p c, pues los físicos siempre escribimos la fórmula de Einstein como E²=(m c²)²+(p c)²). Cuando estas excitaciones no cumplen con dicha ecuación son excitaciones off-shell (“incumplidoras”) que se llaman “partículas virtuales” (no tienen nada que ver con las partículas aunque su nombre puede confundir a los menos inquietos). Cuando el número de partículas (fotones) en cierto volumen elemental es cero, decimos que dicho volumen contiene el vacío del campo, cuya energía y momento totales son cero.
En un campo clásico el estado de vacío no contiene nada, está “quieto” y no presenta ninguna onda ni ningún otro tipo de fluctuación del campo. Sin embargo, en un campo cuántico el estado de vacío está continuamente fluctuando con excitaciones off-shell, por lo que es habitual decir que es un “mar de partículas virtuales” (pero no hay que olvidar que esto es solo una metáfora, que nadie se imagine partículas apareciendo y desapareciendo por doquier). La razón es que si escogemos cierto volumen del espaciotiempo y observamos que el campo en fluctuación está en estado de vacío en dicho volumen, podemos elegir volúmenes más pequeños y observar fluctuaciones que se comportan como “partículas virtuales” que aparecen y desaparecen sin violar la relación de incertidumbre de Heisenberg para la energía y la duración de un proceso, Δt ΔE ≥ ℏ, que permite que fluctuaciones tipo “partícula virtual” con energía ΔE siempre y cuando su duración sea menor de Δt. De hecho, las fluctuaciones del vacío son muy complicadas y si miramos un volumen cada vez más pequeño, ΔE cada vez más grande, seguimos observando más y más fluctuaciones aunque con duraciones cada vez más cortas, Δt cada vez más pequeño.
Los matemáticos dirán que estoy metiendo demasiada física y poca matemática. Los objetos matemáticos con los que hemos de lidiar en teoría de campos son el espaciotiempo, las representaciones lineales de los campos y los potenciales en dicho espaciotiempo, y los grupos de simetría gauge que se aplican a las componentes de estos potenciales, reflejando su redundancia física implícita. El formalismo matemático natural para describir todos estos objetos es la teoría de fibrados de la geometría diferencial. No entraré en definiciones matemáticas rigurosas, solo de interés para quien ya las conoce. Baste decir que un fibrado general es una terna de objetos: un espacio base, un espacio de fibras y un grupo de Lie de simetrías. El espacio base será el espaciotiempo en el que “viven” las fibras, que pueden ser los campos o los potenciales (cada fibra está asociada a un punto del espacio base) y el grupo de Lie representa las simetrías “internas” de las fibras. Lo más sorprendente para el matemático es que en física de partículas no se utiliza la teoría de fibrados más general posible, sino solo la teoría de fibrados principales. En un fibrado principal el espacio de fibras y el grupo coinciden, es decir, las fibras son las transformaciones geométricas del grupo y no hay que introducir un espacio de campos o de potenciales aparte. Todo funciona como si a cada punto del espaciotiempo le asignáramos un grupo de simetrías. Para el físico esto es muy abstracto, pero así son las cosas. Muchos físicos prefieren pensar en dimensiones extra del espacio tiempo que están compactificadas de tal forma que a baja energía “emerge” el grupo de simetrías, sin embargo, por ahora estas ideas tipo Kaluza-Klein son solo eso ideas y esta entrada no es lugar para discutirlas.
¿Qué son entoncces los campos y los potenciales en un fibrado principal? La geometría diferencial nos dice que si el espacio base es un variedad diferencial, entonces el fibrado hereda la estructura de variedad diferencial. En física, el grupo de simetría determina los potenciales y los campos porque los campos son el tensor de curvatura en el fibrado principal. Estoy hay que releerlo. Los campos son la curvatura geométrica del fibrado principal, que unifica espaciotiempo y el grupo de simetrías “internas” (epistemológicamente para un físico es difícil de entender algo tan abstracto). ¿Qué determina el tensor de curvatura? En geometría diferencial la curvatura requiere comparar dos puntos de una variedad y para ello hay que conectarlos de alguna forma, trasladando información geométrica de un punto al otro para poderla comparar; el concepto matemático que realiza esta conexión se llama, como no, conexión. Los potenciales de los campos son las conexiones en el fibrado principal. Por sorprendente que le parezca al matemático, el tensor Fμν del campo electromagnético es un tensor de curvatura y los potenciales Aμ son las conexiones que definen dicho tensor de curvatura. No es necesario introducir los potenciales o campos como fibras, pues emergen de la geometría diferencial del fibrado.
No quiero desviarme del objetivo, la geometría diferencial de las teorías de Yang-Mills, pero muchos lectores se estarán preguntando qué es el fibrado principal desde un punto de vista epistemológico. La verdad es que no lo sabemos. La idea más sugerente nos lleva a teorías de Kaluza-Klein, dimensiones extra del espaciotiempo y teorías de cuerdas. El espaciotiempo, a baja energía o distancias grandes comparadas con la escala de Planck, se comporta como si tuviera cuatro dimensiones y un grupo de simetrías asociado a cada punto. El grupo de simetría podría emerger de una teoría a alta energía o distancias comparables a la escala de Planck en la que hubiera cierto número de dimensiones extra del espacio. No observamos estas dimensiones extra porque serían muy pequeñas y estarían compactificadas (su “volumen” sería finito). Los campos emergerían de la curvatura de estas dimensiones extra. Obviamente, estas ideas son sugerentes, pero ahora mismo no hay evidencia experimental a su favor (aunque está siendo buscada con mucha intensidad desde muchos frentes). Volvamos a mi discurso de hoy.
En el marco de la teoría de campos moderna, los potenciales corresponden a conexiones y las componentes de los campos se pueden representar como componentes del tensor de curvatura asociado a estas conexiones. Los matemáticos saben que para definir el tensor de curvatura es suficiente concretar una conexión (los físicos decimos que el campo viene determinado por los potenciales), siendo superflua la métrica. Sin embargo, en las teorías de campos la métrica es fundamental para poder incluir fuentes de los campos. Para ello hay que utilizar el dual de Hodge de la curvatura, lo que exige especificar una métrica. Incluso en una teoría de campos pura, sin fuentes, los físicos utilizan una métrica para definir una magnitud escalar llamada acción del campo, cuya variación extremal determina las ecuaciones para el campo. Hablando sin rigor, la definición de la acción requiere el cuadrado de la curvatura, que obliga a la introducción de la métrica vía el operador estrella de Hodge. La métrica en el espaciobase es fundamental en teoría de campos gauge o campos de Yang-Mills. Para un físico puede ser obvio, pero quizás un matemático tiene que pensar más en ello.
¿Qué tiene que ver todo esto con el problema del milenio? En la entrada de mañana lo aclararé, pero adelanto que la cuantización de una teoría de campos de tipo Yang-Mills requiere realizar una integral en el espacio de conexiones y para ello hay que definir una métrica en el espacio de conexiones. Una formulación cuántica de una teoría de Yang-Mills requiere caracterizar en detalle las métricas posibles en el espacio de conexiones. Muchos expertos creen que el origen del “salto de masa” está en la topología (en concreto en la cohomología) del espacio de conexiones.
Antes de acabar, seguro que algún lector se preguntará, ¿dónde se encuentra el electrón y otras partículas en todo este lenguaje tan matemático? El electrón es la partícula que corresponde a las excitaciones de un campo, el campo “electrónico” (muchos físicos prefieren llamarlo “campo electrón”). Todos los electrones del universo son idénticos entre sí (indistinguibles) y tienen exactamente las mismas propiedades. La razón es que son excitaciones de un único campo (común a todos ellos), el campo electrón (el vídeo MinutePhysics lo explica muy bien). Este campo tiene espín 1/2, es decir, las excitaciones de este campo se comportan como un vector de cuatro componentes divididas en dos parejas. Más aún, el electrón y el positrón (su antipartícula) son excitaciones diferentes del mismo campo, no son dos campos separados. Aplicando un gauge adecuado se pueden separar las cuatro componentes de tal forma que una pareja representa al electrón y la otra pareja al positrón. Además, las dos componentes de cada pareja corresponden a partículas con helicidad derecha y helicidad izquierda, respectivamente (la helicidad es la proyección del espín en la dirección del momento, es decir, de la velocidad). Dos electrones pueden ocupar el mismo nivel atómico en un átomo (tener la misma energía) si tienen espines opuestos, es decir, si uno corresponde a las excitaciones de las componentes de la pareja y el otro a las de la otra componente.
Y para acabar. El electrón tiene masa porque se acopla al campo de Higgs que logra intercambiar excitaciones de las componentes del campo de helicidad derecha en excitaciones de las componentes del campo de helicidad izquierda y viceversa. El campo de Higgs es, en última instancia, la causa de que no haya dos electrones en la Naturaleza, uno con helicidad derecha y otro con helicidad izquierda, permitiendo que haya un único electrón que “oscila” entre una helicidad y la otra comportándose como si tuviera masa no nula. Pero esta cuestión será discutida en más detalle en una futura entrada.