Menos del 0,5 % de las imágenes aéreas contienen defectos, y es precisamente esta estadística, y no la potencia de la GPU ni la arquitectura del modelo, la que desmonta el enfoque clásico del aprendizaje automático (ML) para el control de calidad de imágenes.
El cuello de botella detrás de cada ortofoto
La producción de imágenes aéreas se ha automatizado en todas las etapas, excepto en la última. La planificación de vuelos, la calibración de sensores, la triangulación aérea y la composición de mosaicos de ortofotografías han pasado de ser procesos manuales a algorítmicos en las últimas dos décadas; el control de calidad de las imágenes sin procesar, no. En la mayoría de los flujos de producción, un operador sigue revisando miles de imágenes, una por una, para señalar nubes, desenfoques, reflejos y otros problemas. El trabajo es lento, costoso y propenso a omisiones, y a medida que los volúmenes de imágenes siguen creciendo —impulsados por programas nacionales de ortofotografía, monitoreo de infraestructura y captura en áreas urbanas densas—, el control de calidad manual crece linealmente con el número de personas, mientras que todo a su alrededor crece con el software.
La paradoja de los datos
Tres cifras explican por qué automatizar esta etapa es más difícil de lo que parece. El 99,5 % de las imágenes aéreas son correctas. Un solo fotograma de gran formato puede pesar hasta 300 MB. Una empresa de cartografía aérea de tamaño mediano captura varios cientos de miles de fotogramas al año; las más grandes procesan varias veces más.
Cada una de estas cifras contradice una suposición diferente en la que se basa el aprendizaje supervisado estándar. El desequilibrio entre clases es tan extremo que, incluso tras años de operaciones, una empresa cuenta, como mucho, con unos pocos miles de imágenes realmente defectuosas —una cifra demasiado pequeña para que un modelo pueda generalizar entre cámaras, GSD, estaciones del año y tipos de terreno. Las máscaras a nivel de píxel para estos pocos ejemplos son caras de crear. Y, una vez que se empieza a transmitir fotogramas de 300 megabytes a través de GPU, la velocidad de transferencia del disco y de la memoria se convierte en el límite, y no la profundidad de la red. El problema de los datos en sí mismo necesitaba reformularse.
Invirtiendo el problema: simuladores, no conjuntos de datos
Si los defectos no se pueden recopilar a escala, se gestionan. El enfoque adoptado en OPEGIEKA consistió en construir un flujo de trabajo de datos sintéticos específico para cada clase de defecto y entrenar una red neuronal convolucional por clase con muestras generadas dinámicamente durante el entrenamiento.
Para el desenfoque, se convolucionan kernels gaussianos aleatorios con imágenes correctas, añadiéndoles una pequeña capa de ruido para preservar una apariencia natural. El detector trata el desenfoque como una propiedad de tipo «todo o nada» del fotograma, en lugar de una propiedad local: una simplificación deliberada que se corresponde con el comportamiento del desenfoque en la fotografía aérea.
Para los reflejos, el generador crea formas radiales aleatorias, las suaviza mediante filtros morfológicos y las inserta en bloques aleatorios. La detección la realiza una red U-net. Solo se evalúan los bloques con valores de píxeles altos, de modo que la mayor parte de la imagen nunca llega a la red.
Para las nubes, el material de origen son imágenes del Sentinel-2 —específicamente escenas con cobertura parcial de nubes sobre mar abierto, donde el fondo radiométrico uniforme del agua permite una segmentación nítida por nube. Cada nube extraída se compone en bloques aéreos correctos con rotación, escala y brillo aleatorios. Las sombras de las nubes siguen la misma lógica en negativo, con un desplazamiento que respeta el ángulo del sol.
El conjunto de datos de entrenamiento es prácticamente ilimitado, y el modelo no sufre sobreajuste con respecto a una escena específica.
En qué acierta el modelo y dónde traza el límite
CertiflAI de OPEGIEKA abarca actualmente seis tipos de defectos radiométricos —nubes, sombras de nubes, desenfoque, reflejos, decoloraciones y áreas quemadas—; cinco de ellos mediante CNN dedicadas y el último mediante una regla basada en regiones continuas de alto valor con baja varianza. Una segunda capa de control realiza verificaciones geométricas rápidas en todo el bloque: superposición final, superposición lateral, tamaño de píxel, omega/phi/kappa, altura del sol y conformidad con el AOI.


En la producción, el proceso radiométrico procesa un fotograma de tamaño mediano en unos 3 segundos y uno de tamaño grande en unos 5. Un lote de 1.631 imágenes de una campaña reciente completó la etapa geométrica en aproximadamente 90 segundos. Las tasas de omisión medidas en pruebas de referencia internas se mantienen por debajo del 5 % para los dos defectos críticos —nubes y desenfoque— y por debajo del 10 % para el resto, con un umbral de falsos positivos ajustable que normalmente se establece en torno al 20 %.
Ningún detector detecta todo a la perfección, y CertiflAI no es la excepción. Los falsos positivos más comunes observados en la producción son plantas de biogás, puntos calientes, humo de pequeños incendios y campos en condiciones inusuales; el humo se ha revelado como una clase recurrente de artefacto que vale la pena señalar. Los candidatos se presentan para que el operador los revise en lugar de ocultarse, y el umbral de sensibilidad se muestra como un parámetro.


Cambios en una agencia cartográfica nacional
CertiflAI se utilizó en producción en tres agencias cartográficas nacionales —GUGiK en Polonia, ICGC en Cataluña y el Instituto Geodésico de Eslovenia— y sirvió para verificar más de un millón de imágenes aéreas entre todas ellas. Los días de trabajo del operador se transforman en horas de computación; el procedimiento es determinístico y parametrizado, en lugar de depender de quién esté de guardia; cada proyecto incluye una pista de auditoría en CSV o XLSX con límites incorporados —adecuada para regímenes de documentación como el PZGiK de Polonia— y la detección en el mismo día acorta el ciclo de retroalimentación para la adquisición. Para las compras públicas, esto significa que los límites de control de calidad pueden figurar directamente en los documentos de licitación, y los proveedores deben demostrar el cumplimiento de un procedimiento definido, en lugar de solo ofrecer garantías.
El problema de la implementación
Un modelo que funciona en el laboratorio no es lo mismo que una herramienta que una agencia va a implementar. Los datos geoespaciales están sujetos a restricciones de confidencialidad que excluyen el uso de SaaS en la nube para la mayoría de los organismos nacionales de cartografía. Por lo tanto, CertiflAI se suministra como una aplicación de Windows para instalación local con una GPU compatible con CUDA, sin necesidad de conexión a Internet durante el funcionamiento.
La lección más amplia
El instinto en el aprendizaje automático es resolver problemas de datos con más datos. El control de calidad (QC) aéreo es un caso en el que ese instinto falla: la ausencia de defectos es una propiedad de los propios datos, no un fallo que deba corregirse. Cuando el desequilibrio se vuelve tan extremo, el simulador se convierte en el conjunto de datos: un patrón que ya abarca desde imágenes aéreas sin procesar hasta ortofotos y que se aplica naturalmente a imágenes oblicuas e imágenes satelitales.
Para obtener más información sobre la recopilación y el procesamiento de datos de alta calidad, póngase en contacto con jakub.krawczyk@opegieka.pl jefe de I+D y Teledetección de OPEGIEKA.
Más información: www.opegieka.pl
OPEGIEKA, parte del consorcio Dephos Group, confirma su participación como expositor en DroneShow, MundoGEO Connect, SpaceBR Show y Expo eVTOL 2026, que se celebrarán del 16 al 18 de junio en el Expo Center Norte – Blue Pavilion, en São Paulo (SP).
Consulta el programa de cursos, seminarios y foros de DroneShow Robotics, MundoGEO Connect, SpaceBR Show y Expo eVTOL. La inscripción anticipada con descuento está disponible y las plazas son limitadas.
Consulta los aspectos más destacados de la última edición:

