Introducción a la Interferometría

La Astronomía

El desarrollo de la ciencia desde tiempos remotos tuvo mucho que ver con la observación del firmamento nocturno. La física ha encontrado siempre un vasto "campo de pruebas" en los cielos. Éstos sugirieron la idea del logos (orden cognoscible) a los antiguos griegos, siendo así que Platón cita la astronomía como disciplina obligatoria para los jóvenes. El estudio de las órbitas llevó a Newton, a partir de los trabajos de Kepler, a desarrollar el concepto de acción a distancia en la Ley Universal de la Gravedad y a trabajar en el cálculo diferencial. Hoy en día, el cosmos constituye un gigantesco laboratorio donde la materia se encuentra en condiciones extremas difíciles de encontrar en la Tierra: partículas a velocidades relativistas, nubes de gas ionizado que emiten radiación coherente, estrellas formadas por un solo núcleo atómico de tres kilómetros de radio...

Sin embargo, la astronomía ha estado limitada principalmente por dos factores: el uso de las frecuencias ópticas y la turbulencia de la atmósfera terrestre.

La atmósfera terrestre: ventanas

Las ondas electromagnéticas a lo largo de todo el espectro radioeléctrico se propagan desigualmente a través de la atmósfera. Aquellas bandas en las que la atmósfera es más o menos transparente se denominan ventanas. La más conocida es la ventana óptica. Se extiende entre las longitudes de onda de 0.3µ a 1µ. La segunda es la ventana radio, que se extiende desde 1mm. a 15m.

El resto de bandas ve mermada su propagación debido a diferentes mecanismos. En las frecuencias ópticas pequeñas, la absorción se debe al ozono. Al aproximarse la frecuencia a los rayos X, la absorción atómica predomina; para longitudes de onda más altas, como los rayos gamma, la absorción nuclear es dominante. En la zona entre la ventana óptica y la de radio encontramos absorción debida al agua y el dióxido de carbono, aunque hay bandas parcialmente transparentes entre 1µ y 24µ, usadas por los sensores de infrarrojos. Para longitudes de onda de radio grandes, el límite viene dado por la frecuencia crítica de la reflexión de la ionosfera, que depende de la hora del día, la localización geográfica, la actividad solar, etc. Esta frecuencia va desde los 20Mhz hasta los 9Mhz y ocasionalmente puede bajar hasta 1Mhz.

Por otro lado, la refracción en la ionosfera produce la ilusión de que un objeto se halla más alto en el horizonte de lo que está.

Hay otros fenómenos atmosféricos que empeoran la observación. En la ventana óptica, las inhomogeneidades locales producen el centelleo de las estrellas y la variación de su tamaño. Este efecto también se produce en la ventana radio, con periodos más largos. Sin embargo, este centelleo puede usarse para estimar el tamaño angular de radiofuentes.

En cuanto a ruido, la radiación cósmica es mucho más potente en bandas radio, llegando a ser 104 veces más potente que la radiación solar en esa misma banda.

Finalmente, la información del universo que se extrae de las distintas bandas es de naturaleza distinta. La radiación óptica que se recibe del cielo se produce por mecanismos térmicos y contiene rayas espectrales de elementos. Los espectros de radio, en cambio, se deben a la radiación de electrones moviéndose a velocidades relativistas y dan información sobre campos magnéticos cósmicos.

Dicho todo esto, la pregunta que surge es: ¿por qué íbamos a tener necesidad de utilizar la ventana radio en la observación del firmamento?

Una cuestión de resolución

El ojo humano es capaz de distinguir detalles de hasta un minuto de arco (la resolución se mide en unidades angulares). La fórmula que relaciona el poder resolutivo del instrumento con la longitud de onda es:

Siendo J el poder resolutivo en radianes, la longitud de onda y D la dimensión máxima del dispositivo colector de radiación (en el caso del ojo sería el diámetro del globo ocular, para un telescopio sería el diámetro del espejo). Un telescopio con un espejo de 10 m tendría un poder resolutivo cuatro ordenes de magnitud mayor que el ojo humano. Sin embargo, esto sólo se cumple en teoría, teniendo un frente de ondas plano. Esto no es así, debido a que la turbulencia de la atmósfera, comentada antes, desorganiza el frente de onda (lo que se denomina incoherencia entre las partes del frente de ondas). Así pues, la D efectiva de un telescopio de 10 m no va más allá de 20 cm. Por otro lado, para un radiotelescopio la resolución, según la fórmula anterior, con =4cm y D=100 m (el mayor radiotelescopio móvil del mundo, en Effelsberg) J=2 minutos de arco, incluso peor que el ojo humano. Sin embargo, hay ciertas propiedades de los radiotelescopios que hacen aconsejable su uso. Aquí es donde entra en juego la interferometría.

Interferometría, o el todo supera a la suma de las partes

La interferometría es una técnica nacida de la concepción de la luz (radiación electromagnética) como onda, debido a los experimentos de T. Young a principios del siglo XIX. A. H. L. Fizeau sugirió su utilización para medir el diámetro angular de las estrellas. E. Stephan cubrió el telescopio de 80 cm del Observatorio de Marsella con una máscara de dos rendijas y acotó el diámetro angular de las estrellas como inferior a 0,15 segundos de arco. Posteriormente, en 1891, Michaelson conseguiría medir el diámetro de las lunas de Júpiter con el telescopio de 30cm del observatorio de Lick, al sur de San Francisco, California. Sin embargo, de esta forma no se conseguía aumentar la D efectiva del telescopio. Esto no se consiguió hasta 1920, cuando el propio Michaelson construyó un dispositivo formado por dos espejos separados 6 m que introducían los haces de luz en el objetivo del telescopio. Esta concepción de interferómetro aumentaba la D efectiva del telescopio, y permitió la medida de los diámetros angulares de siete gigantes rojas. Sin embargo, la interferometría óptica tenía serios problemas: la turbulencia atmosférica afectaba a las figuras de interferencia obtenidas, y la estabilidad de los brazos era muy difícil de conseguir (hay que tener en cuenta que, a frecuencias ópticas, un movimiento de una micra es comparable a la longitud de onda).

Sería en el campo de las ondas de radio donde la interferometría mostraría toda su potencia. En primer lugar, a frecuencias de radio, con longitudes de onda de incluso metros, es más sencillo mantener las antenas estables. Además, la atmósfera afecta menos a las ondas de radio, en el sentido de que permite una mayor coherencia (esto es, menos diferencias de fase) en los frentes de ondas.

Visibilidad: el experimento de las rendijas

En el experimento de Young, se dispone un foco de luz delante de dos rendijas muy estrechas, y una pantalla tras éstas. La luz, al atravesar las rendijas, se difracta y recorre distintos caminos, sumándose las contribuciones de las dos rendijas según su diferencia de fases, con lo que en la pantalla aparecerán franjas claras y oscuras. La anchura de las franjas dependerá inversamente de la distancia a la pantalla, y, además, son perpendiculares a la línea que une las dos rendijas. Si la fuente de luz es puntual, el contraste en las franjas (la diferencia entre las partes claras y oscuras) será muy grande. Si la fuente luminosa es extensa, por el contrario, las franjas en la pantalla se difuminarán. Además, la anchura entre las franjas dependerá de la distancia entre las rendijas. Denominamos visibilidad al mayor o menor contraste entre las franjas.

Imaginemos ahora una fuente luminosa elíptica muy excéntrica. Si la giramos, veremos que el contraste es mayor cuando el semieje menor es paralelo a la línea que une las rendijas (línea base). Esto es así porque la fuente es menos extensa en esa dirección; es como si las rendijas vieran una fuente "más puntual". De la misma forma, si el semieje mayor es el que es paralelo a la línea base, el contraste será mínimo. Vemos de esta forma que, si la fuente está quieta, girando las rendijas obtendríamos información de la fuente.

Seguidamente veremos como se traduce esto para un sistema de antenas.

El interferómetro radio

Supongamos de forma general que un determinado fenómeno físico, localizado en R, produce un campo eléctrico E(R), variable en el tiempo. Como se deriva de las ecuaciones de Maxwell, este campo eléctrico se propagará en todas direcciones. Nos interesa conocer el campo medido en un punto r, o punto de observación. Haremos una simplificación que facilitará el modelo matemático y nos permitirá un análisis posterior en términos de transformadas de Fourier: supondremos un campo eléctrico que se propaga como una onda monocromática de una sola frecuencia, .

En este caso el campo observado en r debido a las contribuciones de todas las posibles fuentes (es decir, para cualquier R) viene dado por:

Si suponemos, para facilitar la notación, que el campo eléctrico es escalar en vez de vectorial, entonces la función Pv(R,r) (a la que llamaremos función de propagación) es también escalar. En un caso más general, en el que tuviéramos en cuenta el carácter vectorial del campo, y por ello el fenómeno de la polarización, Pv(R,r) sería una función tensorial.

Desde un punto de vista práctico, nos resulta imposible (y también innecesario) llegar a conocer el valor del campo eléctrico en la posición exacta de los objetos que observamos. En su lugar, supondremos que todos los objetos bajo observación se encuentran en el exterior de una esfera imaginaria (cualquier superficie sería válida), mientras que nuestro interferómetro se encuentra en el interior. A todos los efectos, el teorema de Green nos garantiza que el campo medido en el interior de nuestra esfera solo depende de las condiciones de contorno en la superficie. Es decir, solo nos preocupa el campo electromagnético en la superficie de la esfera, generado por los objetos celestes externos a ella.

La segunda simplificación que haremos será suponer que nos hallamos en una situación de propagación en el vacío con un frente de ondas esférico, con lo que la función de propagación será la función de Green:

Es decir, el campo eléctrico producido en cada punto de la esfera se atenúa como |R-r|-1 y sufre un desfase de k|R-r| radianes.

Coherencia espacial del campo eléctrico

Ahora supongamos que observamos el objeto desde dos puntos, dos antenas, que forman el interferómetro más simple. Éstas van a hacer el papel de las rendijas.

Supongamos que conocemos el valor en una superficie S del campo eléctrico generado por un serie de fuentes. El campo medido en dos puntos r1 y r2 valdrá:


La operación equivalente al "batido" de las ondas en el experimento de las rendijas es la correlación. Si calculamos la correlación cruzada entre ambas distribuciones de campo obtenemos:

Los corchetes <,> representan la esperanza matemática. Sustituyendo las ecuaciones completas, e introduciendo las variables ficticias de integración R1 y R2 (que en realidad se refieren a la misma esfera imaginaria), obtenemos:

Si hacemos la suposición de que el campo generador es espacialmente incoherente, es decir que se cumple que su correlación es nula excepto para R1=R2:

entonces, sacando el símbolo de integración fuera de la esperanza matemática y aplicando la condición anterior, la correlación cruzada medida en los puntos de observación vale:

Si añadimos la suposición de que las fuentes están muy alejadas de los observadores e introducimos el vector unitario s y la función luminosidad Iv(s):

entonces la expresión de la correlación cruzada queda:

Si somos capaces de invertir esta ecuación podremos obtener la distribución de campo en los objetos lejanos (más concretamente Iv(s), la luminosidad) a partir de la función de correlación espacial (también llamada función de coherencia espacial) del campo medido en nuestro interferómetro. Nótese que está función no depende de la posición de los observadores (antenas), sino de su distancia.

Esta función es la que obtenemos de los registros de las antenas y se denomina función de coherencia espacial, o visibilidad.

Inversión de Fourier de la función de coherencia espacial

Desde el principio, nuestro objetivo es obtener una imagen de la distribución de campo eléctrico en la zona de estudio. Como se puede intuir a partir de la ecuación anterior, la obtención de la luminosidad Iv(s) pasa por invertir la integral. Existen dos aproximaciones alternativas que nos permiten hacer esto:

Medición sobre un plano

Supongamos que todas las antenas que forman nuestro interferómetro se encuentran sobre un determinado plano. Podemos elegir un sistema de coordenadas tal que todos los puntos de dicho plano tengan un vector de coordenadas (u,v,0). Podemos normalizar las unidades respecto de la longitud de onda de trabajo de forma que podamos expresar el vector r1-r2 como .(u,v,0).

En este sistema coordenado, el vector s queda como:

Con lo que la función de coherencia espacial Vv(r1, r2) queda:

Esta expresión es una transformada de Fourier, invertible por métodos numéricos, para obtener Iv(l,m) a partir de Vv(u,v).

Fuentes próximas entre sí

Si, por el contrario, suponemos las antenas colocadas en posiciones arbitrarias, pero con todas las fuentes de radiación agrupadas en un pequeño lugar de la esfera imaginaria, podemos suponer que s=s0+d, con d pequeño, de forma que podamos despreciar todos los efectos de segundo orden que se deriven de él. Como tanto s como s0 son vectores unitarios, se deduce que d es perpendicular a s0, siempre que |d| sea pequeño. Esta condición se cumple a menudo en la práctica, debido a que la directividad del interferómetro es muy elevada, y de hecho explora una región pequeña del cielo.

Por tanto, podemos elegir un nuevo sistema de coordenadas donde s0=(0,0,1) y d=(l,m,0). En este sistema de coordenadas, r1-r2=.(u,v,w) La ecuación resultante para la función de coherencia espacial es:

Vv(u,v) es, en este caso, la función de coherencia espacial relativa a la dirección s0, o centro de seguimiento de fase. El factor ej2w, por ser constante, lo hemos incluido en V usando la función V'. Además, nos ahorramos el factor en raíz cuadrada que dividía a Iv.

Una vez obtenidas estas fórmulas, es inmediato determinar que

Esta última ecuación es la que nos da la "imagen" de los objetos celestes a partir de la correlación de los campos medidos en el interferómetro.

Debe notarse que para conocer la distribución de brillo en el dominio de l,m hay que tener datos de función coherencia espacial par múltiples puntos u,v (en teoría, y si usasemos la transformada continua de Fourier, en todo punto del espacio). Estos registros en ocasiones se toman aprovechando el movimiento de rotación de la Tierra (es el efecto de girar las rendijas en el experimento).

Efecto del muestro de la función de coherencia espacial

La función Vv(u,v) no es conocida en todos los puntos del plano (u,v). Pretender conocer Vv(u,v) en todos los puntos implicaría disponer de infinitas antenas, cosa obviamente imposible. Únicamente conocemos Vv(u,v) en una conjunto limitado de puntos, por lo que podemos suponer que esta función está multiplicada por otra función de muestreo S(u,v), que vale 0 en los puntos del plano (u,v) donde no tenemos datos.

El resultado de esta función de muestro es que la imagen obtenido mediante la transformada inversa de Fourier sale deformada:

Transformando la multiplicación en el dominio (u,v) en una convolución en el dominio (l,m), obtenemos que

donde la función B(l,m) es la transformada de Fourier de la función de muestreo S(u,v):

Los radioastrónomos denominan a IvD(l,m) la "imagen sucia". Esta "imagen sucia" tendrá que ser postprocesada digitalmente para obtener la imagen deseada Iv(l,m).

Interferometría conexa

Denominamos interferometría conexa a la interferometría que se realiza estando las antenas físicamente conectadas, generalmente mediante guiaondas. Si en lugar de ceñirnos al movimiento de la Tierra para obtener el diagrama de Radiación lo que movemos es el diagrama de radiación (induciendo desfases en las antenas) obtenemos un interferómetro de barrido, llamado así porque "barre" el cielo, y permite la observación de fenómenos de corta duración, como llamaradas solares. En el interferómetro de inversión de fase se invierte periódicamente la fase de uno de los elementos. Este tipo de interferómetros presentan ventajas sobre el interferómetro aditivo básico, reduciendo el ruido de baja frecuencia en general y el efecto del brillo de fondo del cielo en particular, y eliminando interferencias captadas por una sola antena.

Si se incrementa el número de elementos, respetando la distancia S entre ellos, se puede conseguir un diagrama más directivo reduciendo el ancho de los lóbulos. De hecho, el ancho de haz a media potencia (HPBW) depende de (nS)-1, siendo n el número de elementos. Si la apertura de cada uno de los elementos es del orden de S, se eliminarían todos los lóbulos excepto el principal. Un interferómetro de este tipo se comporta como una apertura única del tamaño de la distancia máxima entre elementos, aunque la sensibilidad del sistema es peor que la de una apertura continua de ese tamaño.

Otro método comúnmente usado es la síntesis de apertura. Consiste en usar un interferómetro de base variable, situando los elementos en las distintas posiciones que tendrían los de un sistema completo. Sumando los resultados de los registros de forma ponderada se puede obtener un único registro, en principio idéntico al obtenido por el sistema completo. Para este tipo de trabajos se utilizan radiotelescopios montados sobre vías, como el VLA, situado en los Llanos de San Agustín en Nuevo México, USA.

El paso siguiente en refinar la técnica consiste en no necesitar que las antenas estén conectadas entre sí. En el Reino Unido, la iniciativa MERLIN (Multi Element Radio-Linked Interferometer Network) consiste en una red de radiotelescopios que se extiende por toda Inglaterra. Las antenas graban los registros y los transmiten vía radioenlace de microondas al centro de Cambridge, donde se realiza la correlación de los registros para obtener la función visibilidad. De esta forma, se consiguen, con longitudes de onda de 6 cm, resoluciones de hasta 50 milisegundos de arco.

Visto esto, no hay ninguna razón para no dar el siguente paso: la utilización de antenas dispersas por todo el planeta.

Interferometría de línea base muy grande: VLBI

Siempre que las antenas del interferómetro no estén conectadas, y especialmente cuando las líneas base son muy grandes, se hace necesario sincronizar las antenas para que tomen los registros de forma simultánea. Así pues, el desarrollo de la VLBI vino dado por la consecución de precisiones muy altas en los relojes atómicos. Con el advenimiento de esta técnica, el límite para D viene dado por el tamaño de la Tierra, 12000 km. De esta forma se consiguen resoluciones de 1 milisegundo de arco.

Hoy en día, existen diversas organizaciones internacionales que coordinan las observaciones interferómetricas. En USA, los diez radiotelescopios del VLBA (Very Long Baseline Array) son coordinados por el observatorio nacional de radioastronomía (NRAO) en Nuevo México, USA. En Europa, la iniciativa de VLBI (EVN, European VLBI Network) es gestionada por el JIVE, Instituto conjunto de VLBI en Europa, con sede en Dwingeloo, Holanda. En cuanto a centros de correlación de registros, encontramos el de Haystack en Masachussetts (dependiente del MIT), Washington (del observatorio naval de los USA, USNO), Socorro en Nuevo México (dependiente del VLBA) y el de Bonn, del Instituto Max Planck (MPIfR). Actualmente se planea la construcción de un correlador para el EVN en el JIVE en Dwingeloo, Holanda.

Interferometría espacial

Dado que la máxima distancia entre antenas en la Tierra es de 12.000 km, el paso siguiente es poner una antena en órbita. De esta cuestión no se comentará mucho aquí, ya que estos temas se desarrollarán más profusamente en los otros apartados.

En Febrero de 1997, el primer radiotelescopio espacial fue lanzado por la agencia espacial japonesa. VSOP (VLBI Space Observation Programme) es fruto de un acuerdo entre las distintas organizaciones internacionales dedicadas a la interferometría. Por su parte, Rusia tiene planeado lanzar un satélite propio, RadioAstron.

Una vez cumplida la vida útil de VSOP, el proyecto que le substituirá se denomina ARISE, y está previsto su lanzamiento hacia el 2004.