Menos de meio por cento das imagens aéreas contém defeitos – e é essa única estatística, e não o poder da GPU ou a arquitetura do modelo, que desmonta a abordagem clássica de aprendizado de máquina (ML) para o controle de qualidade de imagens.
O gargalo por trás de cada ortofoto
A produção de imagens aéreas foi automatizada em todas as etapas, exceto na última. O planejamento de voo, a calibração de sensores, a triangulação aérea e a composição de mosaicos de ortofotografias passaram de manuais para algorítmicos nas últimas duas décadas; o controle de qualidade dos quadros brutos, não. Na maioria dos fluxos de produção, um operador ainda folheia milhares de imagens, uma a uma, para sinalizar nuvens, desfoque, reflexos e outros problemas. O trabalho é lento, caro e propenso a omissões, e à medida que os volumes de imagens continuam crescendo – impulsionados por programas nacionais de ortofotografia, monitoramento de infraestrutura e captura em áreas urbanas densas –, o controle de qualidade manual cresce linearmente com o número de pessoas, enquanto tudo ao seu redor cresce com o software.
O paradoxo dos dados
Três números explicam por que automatizar essa etapa é mais difícil do que parece. 99,5% das imagens aéreas estão corretas. Um único quadro de grande formato pode pesar até 300 MB. Uma operadora de mapeamento aéreo de médio porte captura várias centenas de milhares de quadros por ano; as maiores processam várias vezes mais.
Cada um desses números contraria uma suposição diferente que sustenta o aprendizado supervisionado padrão. O desequilíbrio de classes é tão extremo que, mesmo após anos de operações, uma empresa detém, no máximo, alguns milhares de quadros realmente defeituosos — um número muito pequeno para que um modelo possa generalizar entre câmeras, GSDs, estações do ano e tipos de terreno. Máscaras em nível de pixel para esses poucos exemplos são caras de se criar. E, uma vez que se começa a transmitir quadros de 300 megabytes por meio de GPUs, a taxa de transferência do disco e da memória se torna o limite, e não a profundidade da rede. O próprio problema dos dados precisava ser reformulado.
Invertendo o problema: simuladores, não conjuntos de dados
Se os defeitos não podem ser coletados em escala, os gestiona. A abordagem adotada na OPEGIEKA foi construir um pipeline de dados sintéticos dedicado para cada classe de defeito e treinar uma rede neural convolucional por classe em amostras produzidas dinamicamente durante o treinamento.
Para o desfoque, kernels gaussianos aleatórios são convolucionados com imagens corretas, com uma pequena camada de ruído adicionada de volta para preservar uma aparência natural. O detector trata o desfoque como uma propriedade do tipo “tudo ou nada” do quadro, em vez de uma propriedade local – uma simplificação deliberada que corresponde ao comportamento do desfoque na fotografia aérea.
Para os reflexos, o gerador cria formas radiais aleatórias, suaviza-as por meio de filtros morfológicos e as insere em blocos aleatórios. A detecção é realizada por uma rede U-net. Apenas os blocos com valores de pixels elevados são avaliados, de modo que a maior parte da imagem nunca chega à rede.
Para as nuvens, o material de origem são imagens do Sentinel-2 – especificamente cenas com cobertura parcial de nuvens sobre mar aberto, onde o fundo radiométrico uniforme da água permite uma segmentação nítida por nuvem. Cada nuvem extraída é composta em blocos aéreos corretos com rotação, escala e brilho aleatórios. As sombras das nuvens seguem a mesma lógica em negativo, com um deslocamento que respeita o ângulo do sol.
O conjunto de treinamento é efetivamente ilimitado, e o modelo não sofre sobreajuste a uma cena específica.
O que o modelo acerta e onde ele traça o limite
O CertiflAI da OPEGIEKA abrange atualmente seis tipos de defeitos radiométricos – nuvens, sombras de nuvens, desfoque, reflexos, descolorações e áreas queimadas – cinco deles por meio de CNNs dedicadas e o último por meio de uma regra baseada em regiões contínuas de alto valor com baixa variância. Uma segunda camada de controle realiza verificações geométricas rápidas em todo o bloco: sobreposição final, sobreposição lateral, tamanho de pixel, omega/phi/kappa, altura do sol e conformidade com a AOI.


Na produção, o pipeline radiométrico processa um quadro de formato médio em cerca de 3 segundos e um quadro de formato grande em cerca de 5. Um bloco de 1.631 imagens de uma campanha recente passou pela etapa geométrica em aproximadamente 90 segundos. As taxas de omissão medidas em benchmarks internos permanecem abaixo de 5% para os dois defeitos críticos – nuvens e desfoque – e abaixo de 10% para o restante, com um limiar de falsos positivos ajustável normalmente definido em torno de 20%.
Nenhum detector detecta tudo com perfeição, e o CertiflAI não é exceção. Os falsos positivos mais comuns observados na produção são usinas de biogás, pontos quentes, fumaça de pequenos incêndios e campos em condições incomuns; a fumaça surgiu como uma classe recorrente de artefato que vale a pena sinalizar. Os candidatos são apresentados para revisão do operador em vez de serem ocultados, e o limiar de sensibilidade é exposto como um parâmetro.


Mudanças para uma agência cartográfica nacional
O CertiflAI foi utilizado em produção em três agências cartográficas nacionais — GUGiK na Polônia, ICGC na Catalunha e o Instituto Geodésico da Eslovênia — e serviu para verificar mais de um milhão de imagens aéreas entre elas. Dias de trabalho do operador transformados em horas de computação, o procedimento é determinístico e parametrizado, em vez de depender de quem está de plantão; cada projeto traz uma trilha de auditoria em CSV ou XLSX com limites embutidos – adequada para regimes de documentação como o PZGiK da Polônia – e a detecção no mesmo dia estreita o ciclo de feedback para a aquisição. Para compras públicas, isso significa que os limites de controle de qualidade podem constar diretamente nos documentos de licitação, com os fornecedores demonstrando conformidade com um procedimento definido, em vez de apenas com garantias.
O problema da implantação
Um modelo que funciona em laboratório não é o mesmo que uma ferramenta que uma agência irá implementar. Os dados geoespaciais estão sujeitos a restrições de confidencialidade que excluem o uso de SaaS na nuvem para a maioria dos órgãos nacionais de cartografia. O CertiflAI é, portanto, fornecido como um aplicativo Windows para instalação local com uma GPU compatível com CUDA, sem necessidade de conexão à Internet durante a operação.
A lição mais ampla
O instinto no aprendizado de máquina é resolver problemas de dados com mais dados. O controle de qualidade (QC) aéreo é um caso em que esse instinto falha: a ausência de defeitos é uma propriedade dos próprios dados, não uma falha a ser corrigida. Quando o desequilíbrio se torna tão extremo, o simulador se torna o conjunto de dados – um padrão que já se estende de imagens aéreas brutas a ortofotos e que se aplica naturalmente a imagens oblíquas e imagens de satélite.
Para mais informações sobre coleta e processamento de dados de alta qualidade, entre em contato com jakub.krawczyk@opegieka.pl, Chefe de P&D e Sensoriamento Remoto da OPEGIEKA
Saiba mais: www.opegieka.pl
A OPEGIEKA, integrando o consórcio Dephos Group, está confirmada como expositora na feira DroneShow, MundoGEO Connect, SpaceBR Show e Expo eVTOL 2026, que será realizada de 16 a 18 de junho no Expo Center Norte – Pavilhão Azul, em São Paulo (SP).
Conheça a programação de cursos, seminários e fóruns do DroneShow Robotics, MundoGEO Connect, SpaceBR Show e Expo eVTOL. As inscrições podem ser feitas antecipadamente com desconto e as vagas são limitadas.
Veja os destaques da última edição:

