Filtro predictivo de ruido en señales GNSS con modelos de aprendizaje profundo

Pineda, David

1 · Introducción y problema

Una red de sensores GNSS distribuida de norte a sur de Chile, administrada por el CSN, produce series-tiempo de posicionamiento. El desplazamiento derivado de GNSS a 1 Hz no se satura en sismos de gran magnitud —a diferencia de velocidad y aceleración—, pero su señal arrastra un ruido de ~3–7 cm (media 4 cm) por efectos no corregidos: ionósfera, troposfera y fase de la onda satélite–receptor.

El valor estimado se hace significativo desde ~5 cm de desplazamiento —equivalente a un sismo de magnitud 6,9 Mw—. De ahí la pregunta de investigación que vertebra el trabajo: ¿es posible diseñar un filtro predictivo de ruido que otorgue mayor sensibilidad a la detección?

2 · Hipótesis y objetivos

Hipótesis. Es posible diseñar e implementar un filtro predictivo basado en modelos de aprendizaje profundo que reduzca el ruido en señales GNSS en tiempo real, mejorando la sensibilidad para la detección de eventos sísmicos y habilitando herramientas modulares para sismología.

Objetivo general: desarrollar e implementar un filtro de ruido eficiente para flujos GNSS en tiempo real. Objetivos específicos:

1Analizar exhaustivamente las secuencias de la red de estaciones GNSS para comprender sus características y patrones.
2Seleccionar y aplicar modelos predictivos que permitan procesar e interpretar esas secuencias.
3Definir métricas precisas para evaluar el rendimiento de los modelos según sus hiperparámetros.
4Diseñar estrategias de paralelización eficientes para implementar el filtro en GPU.

3 · Metodología y modelos

El trabajo procede en dos fases. Fase 1 — análisis estático: caracterización de tramos fijos de serie-tiempo para establecer una línea base (estructura micro y macro). Fase 2 — modelos: diseño e implementación de arquitecturas de aprendizaje profundo para filtrar ruido y predecir, agrupando por patrones individuales y grupales, evaluando además la paralelización a GPU.

Sensor-foco y grafo de vecindad

La red se modela como un grafo: cada estación es un nodo que abstrae al sensor y su información, y las aristas conectan estaciones consideradas vecinas según un criterio de distancia. Cada estación se trata así como un centro local (sensor-foco): el modelo extrae —vía convolución o LSTM— los patrones de su vecindad, ya que las estaciones cercanas exhiben tendencias asociadas cuando no hay sismo. Esta representación es la que permite generalizar tomando las estaciones como centros y descartar o ajustar las de menor compatibilidad con el resto.

**Figura 1.** Equivalencia de la red como grafo de vecindad: cada estación es un nodo (sensor-foco) y las aristas conectan vecinos según un criterio de distancia.

Modelos comparados

CNN/MLP · modelo base (baseline)

Etapa convolucional que extrae características sobre el conjunto de estaciones cercanas y sus tres ejes (N, E, U); la convolución produce un vector de características (Z≈9796) que se concatena con vectores de tiempo, posición y distancia, y una etapa MLP fully-connected entrega la señal decodificada con ruido reducido.

RNN/LSTM · mejor modelo

Red recurrente con memoria selectiva a corto y largo plazo (LSTM). A diferencia del baseline no usa convolución: tres capas LSTM bidireccionales en cascada actúan como extractor de características, seguidas de una capa MLP fully-connected de salida. Es la que mejor gestiona las dependencias temporales (mejor AICc).

Transformer · estado del arte

Codificador–decodificador con codificación posicional (necesaria porque la auto-atención no captura el orden temporal por sí sola), capas de auto-atención (cada token influye en cualquier otro sin importar la distancia secuencial), red feed-forward puntual y auto-atención con máscara (evita la fuga de información futura, clave en predicción). Aprovecha GPU en paralelo; en este trabajo no alcanzó el desempeño esperado.

La evaluación combina dos métricas complementarias. El Error Cuadrático Medio (MSE) penaliza la diferencia punto a punto entre la predicción y el valor real:

MSE = (1⁄n) · Σ_i=1ⁿ ( y_i − ŷ_i )²

La distancia DTW (Dynamic Time Warping) estima el error entre dos series-tiempo mediante un índice de similitud basado en la forma de cada curva —qué tan parecidas son—, alineándolas pese a desfases temporales. Así complementa al MSE: capta semejanzas de forma que la comparación punto a punto no ve. El trabajo advierte que DTW tiene dos desventajas importantes, por lo que se emplea junto al MSE y no en su lugar.

**Figura 2.** Arquitectura base del pipeline de procesamiento y modelado de la serie-tiempo GNSS.

**Figura 3.** Arquitectura RNN/LSTM para la predicción de la serie-tiempo (mejor modelo).

4 · Resultados

Los modelos RNN/LSTM fueron los más efectivos para la predicción a partir de datos históricos, superando a CNN/MLP en métricas como el AICc. El Transformer no alcanzó el desempeño esperado y requeriría ajustes de arquitectura para capturar patrones más complejos. Ambos modelos principales se adaptaron a la geografía estudiada tomando las estaciones como centros locales (Fig. 4–5).

**Figura 4.** Comparación de MSE y distancia DTW: CNN frente a la línea base.

**Figura 5.** Mapa de calor del error de CNN/MLP en el espacio de hiperparámetros.

5 · Conclusiones

Mejor modelo. RNN/LSTM: gestiona secuencias temporales, mejor ajuste a las guías de onda y contención del ruido más eficiente.
Limitaciones. Sincronización de datos, estaciones que dejan de emitir y memoria GPU insuficiente para arquitecturas más complejas.
Potencial de expansión. El ordenamiento desarrollado permite incorporar vectores adicionales (velocidad, aceleración) para sismos de baja intensidad.
Impacto. Base para monitoreo sísmico en tiempo real; transferible a medición de ondas en cuerpos (electrodos) o sensores industriales.

6 · Estructura del documento

1Introducción — problema, hipótesis, objetivos, metodología
2Marco teórico — GNSS, geodesia, redes neuronales
3Análisis estático — caracterización de tramos fijos
4Diseño de modelos — CNN/MLP, RNN/LSTM, Transformer
5Resultados — métricas, comparación de arquitecturas
6Análisis dinámico — comportamiento en tiempo real
7Conclusiones — hallazgos, límites, trabajo futuro

Referencias

[1] Vaswani, A. et al. (2017). Attention Is All You Need. NeurIPS. https://arxiv.org/abs/1706.03762
[2] Sakoe, H. & Chiba, S. (1978). Dynamic programming algorithm optimization for spoken word recognition. IEEE TASSP. https://doi.org/10.1109/TASSP.1978.1163055
[3] McInnes, L. et al. (2020). UMAP: Uniform Manifold Approximation and Projection. arXiv:1802.03426. https://arxiv.org/abs/1802.03426
[4] Melgar, D. et al. (2018). Real-time high-rate GNSS displacements for large earthquakes. Geophys. Res. Lett. https://doi.org/10.1029/2018GL078991
[5] Ruhl, C. J. et al. (2017). GNSS displacement sensitivity vs. seismic magnitude. Geophys. Res. Lett. https://doi.org/10.1002/2017GL075675

El documento completo incluye 50 referencias (library.bib).

Cómo citar

@mastersthesis{pineda2024gnss,
  author = {David Pineda},
  title  = {Filtro predictivo de ruido en se\~nales GNSS
            con modelos de aprendizaje profundo},
  school = {Universidad de Chile, DCC},
  year   = {2024},
  type   = {Tesis de Mag\'ister en Ciencias menci\'on Computaci\'on}
}

Resumen