EN
← Volver al Portafolio
Investigación y Tesis diciembre de 2019

Muestreo Basado en Teoría de la Información para Recuperación de Imágenes Geológicas

Tesis doctoral que aborda el posicionamiento óptimo de sensores — dónde ubicar N mediciones para minimizar incertidumbre posterior en campos aleatorios binarios. Introdujo el algoritmo AdSEMES con garantías de submodularidad. Publicado en Mathematical Geosciences y Natural Resources Research.

Algoritmo
AdSEMES
Teoría
Entropía de Shannon, Información Mutua
Publicaciones
3 artículos en revistas
Aplicaciones
Ubicación de sondajes, recuperación de facies
Muestreo Basado en Teoría de la Información para Recuperación de Imágenes Geológicas — Arquitectura
#phd-thesis #information-theory #entropy #geostatistics #optimal-sampling #mining

Contexto de Negocio

El problema de Posicionamiento Óptimo de Sensores es fundamental para exploración mineral, monitoreo ambiental, y cualquier dominio donde la recolección de datos es costosa. Dado un presupuesto de N mediciones, ¿dónde deben ubicarse para aprender lo máximo posible sobre un campo espacial desconocido? Para un campo modesto de 50x50 con 20 mediciones, el espacio de búsqueda excede 10^26 configuraciones posibles. La búsqueda exhaustiva es NP-hard, y los enfoques tradicionales — grillas regulares, ubicación aleatoria — ignoran completamente el contenido informacional espacial.

Valor Estratégico

La tesis introduce AdSEMES (Muestreo Empírico Secuencial Adaptivo de Máxima Entropía), explotando una propiedad matemática clave: la maximización de entropía en este contexto es submodular, garantizando que la selección secuencial greedy alcanza al menos (1-1/e) ≈ 63.2% del óptimo global — una cota demostrable, no una observación empírica. El framework compara seis estrategias de muestreo con funciones de penalización espacial y tres métodos de reconstrucción (vecino más cercano, kriging indicador, distancia inversa ponderada por entropía). Aplicado a ubicación de sondajes para estimación de recursos minerales y discriminación de contactos mineral-estéril. Publicado en Mathematical Geosciences (2019) y Natural Resources Research (2020).

El Desafío

Dado un presupuesto de N mediciones, ¿dónde ubicarlas para minimizar la incertidumbre posterior? La búsqueda combinatoria sobre C(H×W, K) candidatos es NP-hard. Las estrategias de muestreo tradicionales (grillas regulares, aleatorias) ignoran el contenido informacional espacial.

Nuestro Enfoque

Algoritmo AdSEMES (Muestreo Empírico Secuencial Adaptivo de Máxima Entropía) explotando submodularidad para aproximación (1-1/e) al óptimo global. Compara seis estrategias de muestreo con funciones de penalización espacial y tres métodos de reconstrucción. Aplicado a ubicación de sondajes para estimación de recursos minerales y discriminación de contactos mineral-estéril.

Indicadores Clave de Rendimiento

KPILínea BaseResultadoImpacto
Garantía de OptimalidadUbicación heurística(1-1/e) ≈ 63.2% del óptimo globalCota de calidad demostrable
PublicacionesN/A3 artículos en revistas (Math Geosci, NRR)Validación por revisión de pares

Arquitectura

ids owp

ids owp

The Question

Given a budget of N measurements, where should you place them to learn as much as possible about an unknown spatial field? This is the Optimal Sensor Placement problem — fundamental to mineral exploration (where to drill next), environmental monitoring (where to install sensors), and any domain where data collection is expensive.

The search space is C(H×W, K) — combinatorially explosive. For a modest 50×50 field with 20 measurements, that’s over 10²⁶ possible configurations. Exhaustive search is impossible.

The Information-Theoretic Approach

The thesis frames the problem through Shannon entropy and mutual information:

  • H(X) = -Σ p(x) log p(x) — total uncertainty about the unknown field
  • H(X^f | X_f) — residual uncertainty after observing at locations f
  • I(X_f; X^f) = H(X^f) - H(X^f | X_f) — information gained by measuring at f

The goal: choose locations that maximize mutual information. The breakthrough: entropy maximization in this setting satisfies submodularity — adding a measurement to a small set yields more information gain than adding it to a large set. This mathematical property guarantees that greedy sequential selection achieves at least (1 - 1/e) ≈ 63.2% of the global optimum. Not an empirical observation — a provable bound.

The AdSEMES (Adaptive Sequential Empirical Maximum Entropy Sampling) algorithm implements this with spatial penalty functions that prevent clustering and three reconstruction methods (nearest neighbor, indicator kriging, entropy-weighted inverse distance) for recovering the full field from sparse observations.

Publications

  1. “Sampling Strategies for Uncertainty Reduction in Categorical Random Fields” — Mathematical Geosciences, 2019
  2. “Optimal Sampling Strategy for Spatial Estimation of Ore-Waste Contacts” — Natural Resources Research, 2020
  3. “Geological Facies Recovery Based on Weighted L1-Regularization” — Mathematical Geosciences, 2019

Stack Tecnológico

Python NumPy SciPy Information Theory Geostatistics Indicator Kriging LaTeX

Capturas de la Aplicación

Muestreo Basado en Teoría de la Información para Recuperación de Imágenes Geológicas

Diagramas Técnicos

owp adsemes

owp adsemes

owp information theory

owp information theory

owp resolvability

owp resolvability

owp sampling comparison

owp sampling comparison