Este es un minicurso de relatividad general
con una buena base en física general.
No se asume que sepas previamente geometría diferencial,
pero se asume que sí sabe que es una matriz, la notación de subíndices, ecuaciones diferenciales y cosas así.
Antes de ir con la RG una breve introducción
a un aspecto de la relatividad especial:
Se pueden obtener las transformaciones de Lorentz en RE sin usar métricas, Einstein lo hizo así.
Sin embargo usando métricas la cosa queda más elegante y susceptible de generalizar.
Primero aclarar que los físicos teóricos tendemos a trabajar en unidades naturales en que (cuando no en unidades “sobrenaturales” en que todo lo que molesta es mientras no sea imprescindible mostrarlo explícitamente).
Recordemos primero el concepto de métrica
(por si no se tienen claros los conceptos de álgebra de primero).
La distancia usual entre dos puntos es:
Podemos pensar que esa distancia la caracterizamos
por el módulo del vector
.
Así que tenemos que el módulo del vector se puede caracterizar
por una matriz g que cumpla que aquí g sería una matriz
que en su diagonal tendría todos los elementos igual a 1 y el resto 0.
( denota el vector transpuesto).
Esta matriz caracteriza totalmente como medir distancias entre puntos.
Si tomamos otras matrices tendremos otras métricas.
El espacio de Minkowski, el de la relatividad especial,
consta de las 3 coordenadas habituales, x,y,z, y una extra, el tiempo,
pero para tener las magnitudes correctas en vez de t se toma ct.
La esencia de la RE es que la máxima velocidad posible es c,
equivalentemente a que c es constante para todos los observadores inerciales.
Considera dos puntos a=(x_a,y_a,z_a), b=(x_b,y_b,z_b)
y que se emite un rayo de luz en t_a que llega a b en t_b.
Ese rayo cumple:
(la distancia que recorre la luz es ct, si ha llegado a b en
habrá recorrido la distancia que separa esos puntos,
elevando esa identidad al cuadrado obtienes la fórmula anterior)
Esa fórmula se puede poner:
(
, etc).
Y eso ya tiene la forma del elemento métrico,
decir que la luz se mueve a v=c en todos los sistemas inerciales
equivale a decir que el elemento métrico es nulo para las trayectorias
de los rayos de luz en cualquier sistema.
Ahí se ve muy claro de dónde surge el signo negativo
para la coordenada temporal.
Las leyes de Newton, en especial F=ma tienen la misma
forma en distintos sistemas de referencia que se relacionen
por las transformaciones de Galileo
(si sólo consideramos desplazamientos en x :
Estas transformaciones son incompatibles con el principio de RE,
ya que tenemos un métrica nos gustaría perseguir la analogía geométrica,
las transformaciones en que dejan invariante la longitud de los vectores
son los giros, las inversiones y las traslaciones.
Un giro es de la forma:
Se puede ver que si se define
esta trasformación da ,
en el caso Lorentziano se puede mantener la misma interpretación
pero cambiando las funciones trigonométricas por las hiperbólicas.
Recordemos que las funciones trigonométricas cumplen,
en virtud a la fórmula de Euler,
la siguiente relación:
Por analogía se definen las funciones hiperbólicas:
Se puede ver entonces que las funciones hiperbólicas
corresponden a las funciones trignométricas haciendo la sustitución x->ix.
Por tanto se puede ver que un giro de ángulo α respecto al plano x, c.t
tendrá la fórmula:
(Aquí es real y por eso aparecen funciones hiperbólicas,
pero si pusiéramos las ecuaciones del giro convencionales,
con funciones trigonométricas, tendríamos que poner un ángulo imaginario)
Es fácil ver, sustituyendo, que con esa elección se tienes:
Es decir lo que pedíamos, que el elemento de longitud
sea invariante invarianza de c.
Desarrollando esto implica:
lo que sustituyendo da las ecs. de transformación de Lorentz.
Eso es lo bueno del formalismo con métricas, la similitud de tratamiento
con la geometría euclidea
Pasamos ahora a la relatividad general.
Es decir, la teoría einsteniana de la gravitación:
Recordemos que la esencia de la teoría de Einstein, que la masa curva
el espacio, queda muy bien reflejada en su ecuación:
No he incluido el término opcional para la constante cosmológica.
Ya iremos viendo que significa cada término en detalle.
Anticipar que la parte de la izquierda indica la curvatura del espacio-tiempo mediante el tensor de Ricci y el escalar de Ricci R.
Esta curvatura es debida a la materia,
que esta representada por la parte derecha de la ecuación mediante
el tensor de energía momento .
Aquí g es la métrica, básicamente una matriz cuadrada 4×4
(asumimos que estamos en 3 + 1 dimensiones)
en dónde cada una las posiciones depende de la posición y el tiempo.
Recordemos.
Si estamos en un espacio plano y euclídeo de tres dimensiones g sería
diag(1,1,1), diag quiere decir matriz diagonal,
si estamos en un espacio plano minkowskiano,
el de la relatividad espacial sería diag( -1, 1, 1 ,1), el signo (-)
corresponde a la coordenada temporal,
con esto la métrica no seria definida positiva y aparte de vectores
de longitud positiva habría vectores con longitud negativa
y con longitud 0 (distintos del (0,0,0), en general este tip
o de métricas se llaman Lorentzianas.
Esto para las coordenadas cartesianas usuales,
si por ejemplo usamos coordenadas esféricas el espacio euclideo
3d tendría métrica
Este cálculo de la métrica en esféricas se obtiene mediante la matriz jacobiana del cambio a coordenadas esféricas J.
En concreto (
denota la inversa),
Es más fácil para ver que g en polares es
.
Recordemos.
Esta métrica sirve para medir la longitud de vectores,
mediante las fórmulas comunes de multiplicación de matrices por vectores.
Si usamos notación de índices esto se escribiría
(se asume que se suman los índices repetidos,
esto se conoce como convenio de Einstein)
Esta noción de longitud de vectores sirve para medir longitudes en una superficie curva, veamos cómo.
Empezamos por una curva, o sea una región de que se puede escribir
de la forma X(a)=f(a)(t), dónde f(a) son funciones que para cada valor
de t dan el valor de la coordenada ) de la curva(podría pensarse
que es la trayectoria de una partícula que va variando con el tiempo,
la velocidad de esta curva será el vector tangente a esa curva en
cada punto, la noción intuitiva de longitud de una curva sería
dónde
denota la longitud de un vector osea
,
pero aquí el vector sería una función de t (y para espacios curvos,
o espacios planos en coordenadas no cartesianas,
también g sería función de las coordenadas que a su vez serían función de t).
El hecho de usar la derivada proviene de que estamos midiendo la distancia entre dos puntos consecutivos de la curva cómo si fueran rectos, lo que en el límite, cómo siempre, lleva a la derivada.
La dirección tangente es la de la recta que más se parece a la curva en ese punto y la longitud de esos vectores tangentes nos dan así la longitud de la curva
Una superficie 2d es hablando vagamente, una subzona del espacio 3d que se puede parametrizar por dos variables, por ejemplo la esfera unidad, conjunto de puntos de que cumplen
podría parametrizarse mediante coordenadas esféricas y sería:
Bien, ya sabemos medir longitudes en curvas,
ahora pasamos a superficies.
Intuitivamente tenemos la idea de lo que es el plano tangente a una superficie, podemos formalizarlo de varias formas, una de ellas es considerar curvas inscritas en esas superficies, el plano tangente a la superficie estaría generado por los vectores tangentes a todas las curvas que pasan por ese punto.
(una curva sería un subconjunto unidimensional de la esfera que se parametrizaría haciendo que y
fueran funciones de t, i.e.
. Fijarse que el plano tangente es bidimensional, y generalizando si tratáramos
de hiperusperfices de dimensión n (que podríamos pensar cómo subconjuntos
de , aunque eso tiene sutilezas) su plano tangente tendría dimensión n.
Entonces tenemos en cada punto de una superficie vectores que expanden un plano tangente, especificar una forma de medir la longitud de esos vectores es dar una métrica a la superficie, en este caso de 2d la métrica sería una matriz 2×2 (pués los vectores son de dos componentes) dónde los valores de g serían función del punto p de la superficie en que nos hallamos.
Hay varias formas de calcular esa métrica, introducimos una notación
para ver cómo se calcula por ejemplo la métrica de una esfera.
Podemos pensar que tenemos vectores “infinitesimales” dx, dy, dz, que indican desplazamientos “infinitesimales” en esas direcciones, (en concreto dx quiere decir (dx, 0,0), osea un vector de longitud infinitesimal en la dirección x y 0 en las otras ), estos vectores serían una base del espacio vectorial .
Un vector infinitesimal genérico será de la forma (dx , dy , dz), y su longitud al cuadrado sería . (porque la métrica es diag(1,1,1)), en esféricas, usando la misma notación
.
Esas notaciones son equivalentes, es decir podemos expresar g_{ab}
cómo una matriz o mediante “la longitud de un vector infinitesimal genérico”,
en RG se suele usar esta segunda notación.
Bueno, vamos a por la métrica de la esfera de radio R,
una esfera indica puntos con R constante, es decir que no consideramos
variaciones en r, es decir dr=0, por tanto .
Aquí estamos suponiendo que la esfera pertenece a y que estamos midiendo sus vectores tangentes con la métrica usual de
lo cuál parece muy lógico. Pero en realidad esto no es obligatorio.
Podríamos elegir cualquier matriz 2×2 simétrica y nos daría una métrica para los vectores de la esfera, que claro, no sería equivalente en general a la heredada de . Podríamos considerar, p.ej, que estuviéramos en el espacio de Minkowski en 3d, es decir con métrica diag (-1,1,1).
Con esta notación es muy fácil entender cómo se calculan métricas, consideramos y un cambio de coordenadas
, entonces
sustituyendo
.
Bien, hemos visto cómo medir longitudes de los vectores tangentes, nos falta ver cómo medir la longitud entre dos puntos p, q de una superficie, la manera es considerar las curvas que perteneciendo a la superficie unen esos puntos, decimos que la longitud entre p,q=min(longitud de curvas que unen p y q), el problema con esta definición es que el cálculo explicito no parece sencillo. Ahí intervendrán las geodésicas
Ya tenemos la métrica, ahora necesitamos pensar en cuando un espacio esta curvado, la idea es considera un vector y transportarlo paralelamente a lo largo de una línea cerrada.
Si consideramos el círculo unidad en y tomamos un vector cualquiera en un punto, por ejemplo el vector que “empieza” en (-1,0) y acaba en (0,0) tenemos claro que si lo trasportamos por el círculo unidad “paralelamente” 45º en dirección contraria a las agujas del reloj tendremos el vector que “empieza” en (1,0) y “acaba” en (1,1), si giramos una vuelta completa obtendremos el vector original, es decir transportando un vector paralelamente alrededor de un círculo obtenemos el mismo vector, esto es así porque
es plano.
En realidad he hecho trampa, he hablado de vectores que empiezan en un sitio, hacer esto supone que estamos hablando de espacios afines, me explico, es un espacio vectorial, el de los vectores que empiezan en el origen, luego tenemos un sistema de coordenadas cartesianas, que dan la noción intuitiva de un espacio geométrico euclideo, llamémoslo
, y podemos asociar a cada vector de
un vector en un punto p cualquiera de
que es el vector paralelo al inicial y que comienza en p, este espacio euclideo con una copia de
en cada uno de sus puntos se conoce cómo espacio afín y se denota
.
Ahora consideremos que dibujamos un círculo en la 2-esfera, y tratamos de girar un vector paralelamente por ese círculo, el vector resultante no coincidirá con el vector original y eso nos indicará que la esfera es una superficie curvada.
Consideremos el caso más sencillo de la curvatura de una curva, aquí hay una definición muy fácil, la curvatura de una curva indica cómo varia su vector velocidad, este es su vector aceleración, la variación de la velocidad será en dirección perpendicular a su vector tangente.
No entraré en detalles pero esto permite definir cuál de todos los vectores tangentes es que cumplen la condición correcta del ángulo es el bueno.
En realidad esto se ha sistematizado y se usa un punto de ataque complementario, en general la derivada de una función en una curva es un vector, es decir cuando se cambian las coordenadas con que se describe la superficie se trasforma de acorde al jacobiano, sin embargo su derivada en general no se transforma cómo la métrica (se dice que no es un tensor), buscamos una generalización de la derivada que aplicada a un vector de un tensor.
Se puede ver, y ya no entro en detalles, que la condición de transporte paralelo es equivalente a decir que la derivada covariante del vector a lo largo de la curva se anule.
Esta derivada covariante de un vector A se puede indicar con Nabla,
el signo del laplaciano o con una d mayúscula.
Es
es el símbolo de Cristoffel de segunda especie.
Es una cantidad muy importante..
Existen los símbolos de Cristoffel de 1ª especie ,
que tiene una expresión natural en función de la métrica:
Y aunque el significado intuitivo de la curvatura es el que he dicho en realidad lo que suele hacerse es introducir el tensor de curvatura de Riemman que viene a informar de la falta de conmutatividad de la derivada covariante y que puede escribirse por tanto en función de los símbolos de Cristoffel y sus derivadas.
v’=B.v
donde B es la matriz de cambio de base que nos pasa de unas coordenadas a otras.
Esto es válido para los vectores. Sin embargo la propia base del nuevo sistema coordenado cambia con la inversa de la matriz B, denotada B-1, es decir, tenemos:
Aquí e es cualquiera de los vectores base. Por ejemplo en tendríamos que la base canónica tiene
(En esta notación la e no tienen nada que ver con el número e=2.16 )
Un vector arbitrario v tendrá en esa base unas coordenadas (a,b,c), es decir .
Si denoto la coordenada i del vector v por vi tendré que v1=a, etc.
Igualmente para la base canonica denotaría que el vector base e1 tiene coordenadas e11=1.
Fijaros bien que para indicar las coordenadas de los vectores v he usado superíndices mientras que para los del vector he usado subíndices.
Esto deviene en una convención. Se dice que los vectores que se tranforman cómo los vectores base son vecotres covariantes, y sus componentes se denotan con subíndices. Sin embargo los vectores “no base” se dice que son contravariantes y sus coordenadas se denotan con superíndices.
Bien,en física existen cantidades que respecto a unos índices son covariantes y respecto a otras son covariantes.
Estas magnitudes se llaman tensores.
Lógicamente sus componentes contravariantes se denotan con superíndices y sus componentes covariantes respectoa índices.
Las ecuaciones físicas siempre vamos a querer expresarlas mediante
magnitudes tensoriales para que tengan un significado
que sea independiente de la base elegida.
He intentado exponer los tensores de la manera más sencilla posible, espero que se entienda lo suficiente.
Una vez hecha esta pausa continuo con la geometría. recordemos que nos habíamos quedado con el tensor de Riemman.
A partir de él vamos a definir el tensor de Ricci.
El tensor de Riemman (una vez contravariante, tres veces covariante) permite definir el tensor de Ricci
, es decir se obtiene contrayendo (sumando) el tensor de Riemman entre su índice contravariante y su tercer índice covariante. Es este tensor el que aparecía en la ec. de Einstein, (R se define con estos pasos
, es decir, cómo siempre, se usa
, la inversa de
para subir los índices, y
para bajarlos, entonces
.
Tras toda esta matemática que le será difícil de asimilar a quien no este habituado a la notación tensorial de índices, algo de física al fin.
En RG todas las entidades matemáticas que hemos ido introduciendo tienen
un significado físico a parte del matemático.
Por ejemplo tendríamos (
indica aproximadamente) osea 1 /2 Φ, dónde Φ es el potencial newtoniano para una partícula puntual.
Cómo por la ecuación de Poisson Δ Φ =4.. π G. ρ (ρ densidad de masa) podemos hacer una correspondencia Δ (=laplaciano) y en general podemos pensar que los símbolos de Cristoffel están asociados a los potenciales gravitatorios, ya que su derivada, el tensor de Ricci esta asociado a la derivada del potencial gravitatorio.
Estas aproximaciones que dan significado físico a estas cantidades geométricas son lo que se llama el límite newtoniano de las ecs de Einstein linealizadas
Se obtiene considerando que dónde η es la métrica de Minkowski y estamos interesados en variaciones respecto a esa métrica, denotadas por h.
Si se hace esta substitución en las ecs. de Einstein y nos quedaos sólo con términos lineales en h tenemos una expresión sencilla, que si hacemos el cambio dónde
.
(Nota, esta forma tan sencilla de las ecuaciones sólo se da en cierto tipo de sistemas de coordenadas, estos sistemas de coordenadas cumplen una condición, que no indicaré aquí, y cuando trabajamos en estos sistemas coordenados exclusivamente decimos que estamos en el gauge de Lorentz).
Ya hemos visto que el esta relacionado con
, pero poco más hemos dicho de el, en general Tab representa a la materia/energía), por tanto en el vacio sería 0, dependiendo de lo que queramos describir representará materia “clásica” o materia “cuántica”, para la primera se suelen usar modelos hidrodinámicos de la materia, el caso más sencillo, llamada aproximación newtoniana es
Por eso se trabaja con situaciones simplificadas, por ejemplo la solución de Schwarschild se obtiene por consideraciones de simetría.
Esta solución describe un campo con simetría esférica, que estaría producido, lógicamente, por una carga puntual en el origen.
Formalmente sin embargo no necesitaremos en esta situación el tensor , tensor energía momento (tensor e-m de aquí en adelante), así que resolveremos las ecs. de Einstein para el vacío, considerando que las soluciones deben tener simetría esférica.
Las consideraciones de simetía reducen los 10 componentes de la métrica (una matriz tiene 16 componentes, pero si ha de ser simétrica, cómo es el caso para cualquier matriz métrica, lorentziana o riemaniana, sólo 10 son distintos) a 2 funciones independientes f(r) y h(r):
(fijarse que el última término
es la métrica de la 2-esfera).
Ahora que tenemos una “plantilla” para la forma de la métrica podemos tomar
las derivadas que indica el tensor de Ricci y obtenemos unas ecs diferenciales para f(r) y h(r), su solución es la métrica de Schwarschild.
(parte esférica)
Importante notar que esta métrica toma valores infinitos para r=0
y para (la c aparecería en la métrica si no usáramos unidades naturales dónde c=1) .
Esta solución sólo vale fuera de la materia que produce la masa M, dentro habría que hacer una suposición sobre la forma de .
He mencionado brevemente las geodésicas, es hora de hacer más hincapié sobre ellas, hasta ahora hemos visto cómo calcular la métrica, pero no sabemos cómo calcular cómo se mueve la materia en esa métrica, todo el que ha leído divulgación sabe que la materia se mueve en geodésicas del espacio tiempo.
Sin embargo las ecs. de Einstein no tienen ninguna geodésica,¿que falla?,
bien, en realidad cómo ya he dicho una vez dada la métrica en un instante
hará evolucionar la materia según las ecs de Einstein y así tendremos
que recalcular la métrica otra vez, afortunadamente en caso de interé
s se pueden hacer simplificaciones y considerar que hay una materia inamovible, p.ej. el sol que produce la métrica y una materia móvil que no interviene en la configuración de la métrica, los planetas, se puede probar que la ec de Einstein implica que estas partículas “test” se mueven en geodésicas, esta demostración no la dió Einstein, es bastante posterior, así que Einstein se vio forzado a postular ese movimiento geodésico, aunque tenía la intuición de que estaba implícito en su ecuación, cómo de hecho acabo de decir que llegó a demostrarse, este postulado no era “antinatural” pues en relatividad especial se puede ve que la partículas se mueven en líneas que minimizan la longitud.
Esto es para partículas con masa, para partículas sin masa se usa una generalización del principio de la aproximación de “rayos” de la óptica geométrica, en realidad, para luz clásica, habría que considerar el tensor energía-momento del campo electromagnético..
Dejo para terminar la ec. de una geodésica tipo espacio es :
Fijarse que m, la masa, no parece en la ec de las geodésicas, eso significa que todas la partículas “test” siguen la misma trayectoria independientemente de su masa. El tema de los rayos de luz, y las trayectorias que siguen, es ligeramente distinto. El tratamiento usual es usar la ecuación eikonal.
En cualquier caso no lo trataré aquí.
ste post queda pues como una referencia que usaré cuando tenga que explicar a la gente a que me estoy refiriendo cuando hablo de diversos aspectos de la RG.
He usado una aproximación a la matemática implicada a mitad de camino entre la geometçia diferencial clásica, tal cómo se expone en p.ej los libros de Manfredo do Carmo o de D.J.Struick y el calculo tensorial de Levi-Civitta, tal cómo se expone en el Lichnerovic o en el Sokolnikov (esta última es la que usó el mismo Einstein).
Hay formas más rigurosas, e incluso claras pese a ese rigor, de exponer esta geometría, quizás la mas adecuada sea la que aparece en “tensor anaysis on manififolds” de Richard L. Bishop y Samuel I.Goldberg de la editrial dover
(muy barato).
Introduce todos los conceptos de topología necesarios
así que cualquier físco puede entenderlo.
El mejor, con diferencia, libro de geometría en variedades, que es lo que trata el Bishop-Goldberg es el Bpotby “Riemannian Geometry on diferenciable manifolds” de academic press, no es sin embargo autocontenido, es un libro escrito para matemáticos con base previa en topología y geometría diferencial clásica, y además, al menos en la 1ª edición no trata tópicos cómo vectores de Killing y el caso Lorentziano para la métrica, pero a cambio te da una gran seguridad con los temas tratados.
Hay incluso más maneras, una introduce las tétradas (o vielvein) que son imprescindibles para incorporar fermiones en RG, y otras usan la teoría de fibrados principales, pero para entender los principios básicos en mi opinión
no son las más adecuadas.
Espero que la idea sea comprensible...
No hay comentarios:
Publicar un comentario