domingo, 29 de diciembre de 2013

El sinsentido de las medidas cuánticas débiles (32523)

Dibujo20131227 strong measurement - weak measurement - scientific reports

Imagina que te digo que un experimento cuántico ha medido el valor del espín de un electrón obteniendo +100 ℏ, o −100 ℏ. Pensarás que es una broma de 28 de diciembre, pues toda medida cuántica del espín de un electrón debe dar +1/2 ℏ, o −1/2 ℏ. Como hoy es 27 de diciembre, debo haber metido la pata. Sin embargo, estos dos valores son resultados posibles para la medida cuántica débil del espín de un electrón. Más aún, así se titula el artículo original que introdujo las medidas débiles de Yakir Aharonov, David Z. Albert, Lev Vaidman, “How the result of a measurement of a component of the spin of a spin-1/2 particle can turn out to be 100,” Phys. Rev. Lett. 60: 1351–1354 (1988).
 Recuerda que Aharonov es firme candidato al premio Nobel de Física (su nombre aparece en el Hall of Citation Laureates de Thomson/Reuters desde 2009).
Las medidas cuánticas débiles están de moda y permiten publicar artículos en las revistas científicas más prestigiosas. Por un lado, introducen gran número de nuevas “paradojas” cuánticas, muy atractivas para los profanos y para todos los medios. Y por otro lado, permiten “medir” la función de onda cuántica, la posición de un fotón, por qué rendija pasa una partícula en el experimento de doble rendija, la propagación superlumínica en el vacío, energías cinéticas negativas y muchas otras cosas que están prohibidas por las leyes de la física cuántica. Las medidas débiles permiten violar todos los teoremas de la mecánica cuántica, incluido el principio de indeterminación de Heisenberg.
La medida cuántica del espín de un haz de electrones da un valor medio entre +1/2 y −1/2, en concreto = +1/2 (p) −1/2 (1−p), donde p es la probabilidad de que un electrón del haz tenga espín +1/2. Una medida débil del espín en dicho haz de electrones puede dar w = +100, o w = −100. 
¿Cómo se pueden interpretar estos resultados? 
Una interpretación probabilística o estadística de la mecánica cuántica implica que w = +1/2 (pw) −1/2 (1−pw), pero entonces la “probabilidad” débil pw > 1, en el primer caso, o pw < 0, en el segundo. De hecho, lo habitual es que el valor de una “probabilidad” débil sea un número complejo.
Los defensores de las medidas débiles llaman proyecciones a los valores pw, en lugar de “probabilidades” débiles, pero ello no cambia que el significado del valor débil w aún no está nada claro. He leído bastantes explicaciones, pero ninguna me convence. Quizás el lector disfrute con Justin Dressel, Mehul Malik, Filippo M. Miatto, Andrew N. Jordan, Robert W. Boyd, “Understanding Quantum Weak Values: Basics and Applications,” arXiv:1305.7154 [quant-ph]; Holger F. Hofmann, “Quantum states as complex probabilities: The physics behind direct observations of photon wavefunctions in weak measurements,” arXiv:1311.0093 [quant-ph]; Holger F. Hofmann, “What the complex joint probabilities observed in weak measurements can tell us about quantum physics,” arXiv:1303.0078 [quant-ph]; S. Ashhab, Franco Nori, “How the result of a measurement of a component of the spin of a spin-1/2 particle can turn out to be 100 without using weak measurements,” arXiv:0907.4823 [quant-ph]; y muchos otros más.
La interpretación probabilística o estadística de las medidas cuánticas débiles requiere usar probabilidades cuánticas negativas y/o valores sin sentido físico. 
Siempre lo digo, pero conviene recordarlo, las medidas cuánticas débiles no son medidas cuánticas. 
Los defensores de las medidas débiles afirman que nos permiten obtener información relevante sobre un sistema cuántico, aunque su interpretación no sea obvia. Por el contrario, los detractores afirman que como los valores débiles no son únicos, pues dependen más de los detalles del dispositivo de medida usado que del propio sistema medido, no ofrecen ninguna información útil.
Quizás conviene recordar una definición precisa de estos conceptos. Usaré la notación y me basaré en Yutaka Shikano, “Theory of “Weak Value” and Quantum Mechanical Measurements,” arXiv:1110.5055 [quant-ph].
La formulación matemática de las medidas cuánticas débiles no contiene ningún error. Más aún, es muy sencilla y sólo requiere conocimientos básicos de mecánica cuántica. Sin embargo, la interpretación física de los resultados es harina de otro costal.
La interpretación convencional del proceso de medida cuántica se basa en el postulado de proyección de John von Neumann, también llamado colapso de la función de onda. Aunque puede ser explicado sin dicho postulado utilizando el concepto de decoherencia cuántica para describir la interacción entre el sistema de medida y el sistema medido, omitiré los detalles para simplificar la presentación.
Sean el estado inicial del sistema {|{i}\rangle} y el operador hermítico asociado al observable (magnitud) a medir A = \sum_j a_j {|{a_j}\rangle\!\langle{a_j}|} (descrito en la base de sus autoestados A|{a_j}\rangle=a_j{|{a_j}\rangle}). Tras el proceso de medida, se obtiene un valor a_m para el observable Ay el estado final del sistema cambia a {|{f}\rangle}\equiv{|{a_m}\rangle}.
La regla de Born nos permite interpretar el estado inicial como {|{i}\rangle} = \sum_j a_j {|{a_j}\rangle\!\langle{a_j}|i\rangle}, donde |{\langle{a_j}|{i}\rangle}|^2 es la probabilidad de que el sistema inicial tuviera un valor a_j para el observable A. Por ello, el resultado de la medida se puede escribir como
\langle{A}\rangle=\frac{\displaystyle\langle{f}|A|{f}\rangle}{\displaystyle\langle{f}|{f}\rangle}=a_m\in{\mathbb{R}},

donde {|{f}\rangle} es el estado final del sistema.
La idea de una medida débil es que el sistema de medida influya muy poco en el sistema medido. Por ello el proceso de medida débil evita el colapso de la función de onda postulado por von Neumann. 
En su lugar, la medida débil se integra dentro de la evolución unitaria del estado inicial hasta el estado final, que en general no corresponde a un autoestado del observable.
La medida débil da como resultado el llamado valor débil. Para el observable A se calcula como
\langle{A}\rangle_w :=\frac{\displaystyle\langle{f}|A|{i}\rangle}{\displaystyle\langle{f}|{i}\rangle}\in {{\mathbb C}},

donde los estados inicial y final del sistema, |{i}\rangle y \langle{f}|, se denominan estado pre-seleccionado y post-seleccionado, respectivamente.
 El valor de la medida débil es un número complejo sin ninguna restricción, a diferencia del valor \langle{A}\rangle que es real e igual a uno de los autovalores del operador hermítico A.
El proceso de la medida débil se describe mediante la evolución unitaria del sistema. Para formalizarlo se utiliza el operador U(t_2,t_1), que evoluciona el sistema desde el instante t_1 hasta el instante t_2
Utilizando este operador podemos escribir la medida débil como
\langle{A}\rangle_w =\frac{\displaystyle\langle{f}|U(t_f,t)A\,U(t,t_i)|{i}\rangle}{\displaystyle\langle{f}|U(t_f,t_i)|{i}\rangle},

donde U(t,t_i) evoluciona el estado inicial |{i}\rangle hasta el momento t en que se aplica la medida débil y U(t_f,t) lo evoluciona desde dicho momento hasta alcanzar el estado final \langle{f}|. En esta formulación el estado intermedio |{a}\rangle es un estado virtual, imposible de observar, similar a los utilizados en la formulación de la integral de caminos de Feynman.
¿Cómo se puede interpretar el valor débil de un observable cuántico? En mecánica cuántica, la definición del valor \langle{A}\rangle_w utilizando el operador U(t_2,t_1) corresponde a definición estándar de la amplitud de transición entre el estado |{i}\rangle y el estado \langle{f}|, pasando por un estado intermedio, sea |{a}\rangle, tal que el observable es A=|{a}\rangle\langle{a}|. En una medida cuántica se produce una proyección del estado en el instante t y el cuadrado de la amplitud de transición |\langle{i}|{a}\rangle\langle{a}|{f}\rangle|^2 se interpreta como la probabilidad de dicha transición.
Sin embargo, esta interpretación disgusta a los defensores de las medidas débiles, pues implica una proyección del estado (un colapso de la función de onda) durante el proceso de medida, es decir, que la medida débil deje de ser débil. Por ello, muchos físicos prefieren interpretar el valor débil \langle{A}\rangle_w como una “probabilidad compleja” para la transición entre los estados pre-seleccionado y post-seleccionado; más detalles en Graeme Mitchison, Richard Jozsa, Sandu Popescu, “Sequential weak measurement,” Phys. Rev. A 76: 062105 (2007)arXiv:0706.1508 [quant-ph]. La clave en esta interpretación es la relación de completitud
\sum_{a}\langle|{a}\rangle\langle{a}|\rangle_{w}=1,

donde se suma entre todos los posibles estados intermedios (virtuales) durante la medida débil.
En la práctica, los problemas que tiene la interpretación de una medida débil se minimizan cuando se considera la estadística de un gran número de medidas débiles. De hecho, en todos los experimentos con medidas débiles hay que realizar un enorme número de medidas para obtener un resultado discernible. 
Lo habitual es considerar la distribución de probabilidad de los valores débiles en el estado inicial del sistema. El valor medio o esperanza matemática del observable en el estado inicial se calcula como
E[A]=\langle{i}|A|{i}\rangle=\int{df\,\langle{i}|{f}\rangle\langle{f}|A|{i}\rangle}=\int{df\,|\langle{i}|{f}\rangle|^2\,\langle{A}\rangle_w},
donde el valor débil \langle{A}\rangle_w actúa como una variable aleatoria compleja y dP:=|\langle{i}|{f}\rangle|^2\,dfes la medida de probabilidad (o función densidad) asociada a dicha variable aleatoria.
 Utilizando esta formulación se pueden definir la varianza 
Var[A]=\langle{i}|A^2|{i}\rangle-\langle{i}|A|{i}\rangle^2y otros estadísticos.
Esta formulación estadística de los valores débiles da la sensación de que la medida débil reiterada nos ofrece valores del observable y por tanto información relevante sobre el sistema cuántico estudiado. 
Más aún, cuando en lugar de usar medidas débiles se usan medidas cuánticas convencionales, el valor medio E[A] coincide con las predicciones de la mecánica cuántica.
Se han escrito muchas páginas tratando de explicar el significado físico y/o matemático de una “probabilidad” negativa, mayor que la unidad, imaginaria pura o incluso compleja. En algunos ejemplos concretos, algunas explicaciones parecen convincentes, pero al aplicarlas a otros ejemplos aparecen sinsentidos. 
Dibujo20131227 two-state vector description of photon inside the double interferometer
Como nos contaba Enrique F. Borja, “Dime fotón, ¿de dónde vienes?,” Cuentos Cuánticos, 16 Dic 2013, dos de los padres del concepto de medidas débiles, Yakir Aharonov y Lev Vaidman propusieron una nueva interpretación de la mecánica cuántica que según ellos permite interpretar las medidas cuánticas débiles en pie de igualdad a las medidas cuánticas, el formalismo del doble estado (Two-state Vector Formalism). El artículo original es Yakir Aharonov, Lev Vaidman, “Protective Measurements,” Annals of the New York Academy of Sciences 755: 361–373, Apr 1995 (arXiv:hep-th/9411196); recomiendo también de los mismos autores “The Two-State Vector Formalism of Qauntum Mechanics: an Updated Review,” arXiv:quant-ph/0105101, y L. Vaidman, “The Two-State Vector Formalism,” arXiv:0706.1347 [quant-ph].
La idea del formalismo del doble estado es que, durante todo el tiempo que transcurre la medida débil, el estado del sistema cuántico medido es una superposición lineal de su estado futuro (o final) \langle{f}| y de su estado pasado (o inicial) |{i}\rangle
En concreto, en todo instante, el estado es combinación lineal de la evolución hacia el pasado del estado futuro, \langle{f}|U(t_f,t) y de la evolución hacia el futuro del estado pasado U(t,t_i)|{i}\rangle (nótese que ambos estados están evaluados en el mismo instante t). Aharanov y Vaidman han demostrado que los resultados teóricos con este formalismo son idénticos a los obtenidos con la mecánica cuántica convencional. Luego el valor de este formalismo, sea mucho o sea poco, se reduce a la interpretación de los resultados de las medidas débiles.
Algún lector se preguntará cómo evita el formalismo del doble estado las paradojas asociadas a la causalidad (que aparecen siempre que se combinan futuro y pasado). 
La respuesta es sencilla, en esta formulación el pasado y el futuro sólo se conocen cuando el futuro es presente. 
El pasado (estado pre-seleccionado) y el futuro (estado post-seleccionado) sólo están bien definidos de forma simultánea cuando se conoce el futuro (estado post-seleccionado). Esta solución tan sencilla evita cualquier tipo de paradoja temporal.
¿Ayuda el formalismo del doble estado a entender las medidas débiles? 
No lo sé, pero las figuras de Vaidman y sus colegas basadas en este formalismo son bonitas y fáciles de entender (en apariencia). 
Además, el propio Vaidman ha confesado que este formalismo le ayuda a diseñar sus experimentos con medidas débiles, que logra publicar en revistas de gran prestigio.
Quizás, como todo en ciencia básica, mis reticencias con la interpretación de las medidas débiles ofrecida por el formalismo del doble estado son debidas a que no estoy habituado a dicho formalismo.
 Con la práctica continuada el científico se acomoda a muchos conceptos abstractos hasta hacerlos “naturales” y ya no puede prescindir de ellos. 
 Aún me siento muy incómodo con la interpretación basada en este formalismo
. Por fortuna no soy el único y muchos expertos se encuentran en la misma situación.