Por Wilson Holler
A indicação de parâmetros estatísticos nos relatórios resultantes do processamento de dados GNSS muitas vezes gera confusão e levanta algumas dúvidas, como por exemplo: O que significam esses valores? Ou ainda, esses valores indicam que meu processamento foi bem sucedido ou não? Fundamentado nestas questões, tentarei desmistificar alguns desses parâmetros, explicando de maneira breve o que significam seus valores.
Os relatórios geram um grande número de observações capturadas e processadas automaticamente, sem que os profissionais possam interferir nos parâmetros de processamento. Mas como podemos verificar se existem erros grosseiros nas observações GNSS, e como tomar as devidas precauções para que o ajustamento dessas observações não forneça resultados comprometedores?
Ajustamento de observações
Esse processo objetiva a estimativa da qualidade da solução gerada. No ajustamento de observações por mínimos quadrados, são aplicadas pequenas correções às linhas de base, para obter a que melhor se ajuste a todas as linhas de base, produzindo assim uma única solução para todos os pontos. Essas pequenas correções são chamadas resíduos. As linhas de base possuem três resíduos, um para cada componente do vetor (X, Y, Z).
Quantificar os resíduos ajuda a identificar problemas nas linhas de base utilizadas no ajustamento de redes.
Os programas, em geral, analisam os resíduos em duas formas: resíduos em unidades lineares (metros) e resíduos normalizados. Os resíduos normalizados levam em conta que os resíduos gerados por erros acidentais são, de alguma maneira, estatisticamente previsíveis. Os resíduos normalizados são valores dos resíduos atuais, escalonados e sem unidade.
A verificação dos valores dos resíduos é um bom indicativo da qualidade das linhas de base.
Pra que serve o teste Tau?
O teste Tau é uma técnica estatística para determinação de erros grosseiros. É um valor interno, calculado em uma distribuição e baseado no número de observações, nos graus de liberdade e em uma probabilidade fornecida (95%).
O teste utiliza os resíduos normalizados de uma observação para determinar se, estatisticamente, o resíduo se encontra dentro dos limites esperados. Um valor de entrada é calculado, a fim de examinar cada resíduo normalizado. Cada resíduo é testado e pode passar, indicando que o resíduo não é maior do que o limite esperado, ou falhar, indicando que a magnitude do resíduo normalizado é maior do que o limite esperado.
É importante ter consciência que, se um resíduo não passa no teste estatístico, isso não significa que exista um erro naquela observação. A observação é simplesmente marcada como um erro grosseiro outlier, a fim de que seja examinada, e se possa tomar uma decisão, mantendo-na ou eliminando-na da rede.
Pra que serve o teste qui-quadrado (Chi Square)?
É um teste estatístico global para uma rede de ajustamento. É um teste da soma dos pesos dos quadrados dos resíduos, o número de graus de liberdade e uma probabilidade crítica de 95% ou maior.
O propósito desse teste é rejeitar, ou aceitar, a hipótese de que os erros previstos tenham sido precisamente estimados. Permite conhecer a qualidade do ajustamento de uma rede. Tipicamente, quando o fator de referência se aproxima de 1.0 e os graus de liberdade são aceitáveis, e ainda a rede está matematicamente coesa, então esse teste passa.
Ele verifica a validade dos resultados obtidos no ajustamento, analisando se a diferença entre a variância de peso para unidade a posteriori (calculada) e a variância de peso para unidade a priori, geralmente 1, é significativa. Se o valor da variância de peso para unidade a posteriori for, estatisticamente, igual a 1, os valores dos resíduos determinados são próximos às incertezas das observações.
O teste qui-quadrado apenas detecta inconsistências no ajustamento. Logo, é necessário o uso de ferramentas adicionais para detectar outros possíveis erros. Se, no processamento, seus dados não passarem (fail) nesse teste, pode ser uma indicação de que alguns (ou todos) os erros a priori tenham sido incorretamente modelados.
Ao fazer um ajustamento pelos mínimos quadrados, o fechamento matemático da rede é um importante fator. Considere o teste do qui-quadrado um primeiro indicador no processamento de dados GNSS.
Não é raro uma rede de boa qualidade falhar no teste qui-quadrado, e resíduos isolados excederem o critério Tau. Porém, isso não representa, necessariamente, razões para se rejeitar o ajustamento.
Outros parâmetros
Existem ainda outros parâmetros que podem ser analisados nos relatórios. Esses parâmetros, junto com os testes estatísticos Tau e qui-quadrado, ajudam-nos a entender como está a qualidade das observações, do processamento e do ajustamento de uma rede GNSS.
Existe uma variação nos nomes desses parâmetros, mas normalmente são utilizadas expressões em inglês. A seguir estão relacionados alguns parâmetros e seu significado:
Erro Padrão da Unidade de Peso (Standard Error of Unit Weight): é a medida da magnitude dos resíduos das observações em uma unidade de peso adotada no ajustamento de rede, quando comparada com erros das observações estimados por um pré-ajustamento;
Fator de Referência (Network Reference Factor): esse valor permite conhecer quão bem os erros de ajustamentos a priori (pré-ajustamento) estão de acordo com os erros a posteriori (pós-ajustamento). Em outras palavras, o Fator de Referência é útil para mostrar quando os erros aleatórios nas observações são aceitáveis, e se eles fecham com os desvios padrão para essas observações. Uma vez que o Fator de Referência se aproxima de 1.0, significa que os erros nas observações estão adequadamente estimados;
Graus de Liberdade (Degrees of Freedom): permitem saber a quantidade global de redundâncias numa rede. Graus de Liberdade identificam o número de observações independentes incluídas no ajustamento, que foram usadas para determinar as soluções. Quanto maior o número, maior redundância tem-se no ajustamento;
Nível de Significância (Level of Significance): é uma expressão de probabilidade. Um sigma é dito ter um nível de significância de 68%. Para erros unidimensionais, com 95% de nível de significância é expressado como 1.96 sigma;
Ratio: é uma medida de quão boa foi a determinação de solução fixa, e números grandes são considerados bons. Geralmente, o teste Ratio é ignorado quando a solução final for flutuante (float) ou de código. O Ratio deve ser acima de 5 para inicializações OTF (On The Fly);
Variância de Referência (Reference Variance): é um valor de medida que mostra como está sua linha de base em relação à determinação de seu erro. Idealmente, a variância de referência deve ser 1.0. Valores menores do que esses indicam que erros menores do que o esperado foram encontrados. Valores maiores indicam que mais erros do que o esperado foram encontrados.
Vimos que as opções de análise dos resultados não se limitam a uma apenas. Esses testes estatísticos podem, e deveriam sempre, ser utilizados como ferramentas para se chegar ao final do ajustamento, com resultados condizentes com os objetivos do levantamento.
Para se chegar à precisão da Norma Técnica para Georreferenciamento de Imóveis Rurais do Incra (NTGIR), devemos levar em consideração alguns desses cuidados.
Espero que, com as considerações desse artigo e do anterior, tenha contribuído para o conhecimento dos profissionais que trabalham com a tecnologia GNSS.
Devemos agora, aguardar a reformulação da NTGIR para saber se haverá novos parâmetros de precisão aceitáveis nos levantamentos GNSS, além do tipo de solução, dos desvios-padrão e da aceitação no teste qui-quadrado.
Wilson Holler é engenheiro cartógrafo e consultor em geotecnologias
geoquality@gmail.com