Dados de posicionamento são obtidos por métodos imperfeitos, por mais precisos que sejam

Uma das questões mais interessantes na agenda atual de pesquisa na área de geoprocessamento nos últimos tempos é a representação computacional da incerteza. Sabemos que nossos computadores não são capazes de lidar com toda a complexidade do mundo real. Mesmo com todo o avanço tecnológico, podemos apenas almejar representações cada vez mais refinadas, que constituem aproximações melhores da realidade: a diferença entre representação computacional e realidade, embora possa estar diminuindo, sempre existirá. Com isso, precisamos aprender a conviver melhor com essa diferença, e para isso precisamos compreender melhor o conceito de incerteza. O primeiro aspecto ligado a incerteza que nos vem à mente é a imprecisão das medidas. Nossas representações do mundo real estão intimamente ligadas à captura de conceitos abstratos e características genéricas das coisas, dentre as quais se destacam a forma geométrica e a localização espacial, conceitos básicos do geoprocessamento. Mas essa forma geométrica é, de fato, uma simplificação, uma abstração da aparência visual de algum elemento do mundo real, e portanto sua construção depende de um processo de captura da realidade envolvendo medições, ou de uma definição da forma geométrica idealizada para algo que ainda não existe. No caso da localização ocorre o mesmo: dados de posicionamento são obtidos por métodos que são inerentemente imperfeitos, por mais precisos que sejam. Com isso, é necessário lidar com a incerteza do ponto de vista da incorporação às representações computacionais de parâmetros que nos permitam quantificar os erros de medição e posicionais que podem ocorrer.

Além deste componente geométrico/posicional, quaisquer questões relativas à qualidade da informação são também relevantes para o debate sobre a incerteza. Sistemas de informação cadastrais, por exemplo, sofrem bastante com o fato de não ser possível acompanhar instantaneamente a dinâmica urbana. Portanto, sempre existirá sobre esse tipo de sistemas a dúvida "será que este dado está atualizado"? As melhores respostas que os administradores desses sistemas podem dar envolvem dar ao usuário dos dados uma noção dos processos empregados para a atualização sistemática – uma forma de assegurar ao interessado que, mesmo que o dado não esteja perfeito, o problema de atualização constante é adequadamente tratado.

Nisso ressurge uma polêmica antiga entre GIS e cartografia: não adianta ter uma excelente precisão de posicionamento para um dado, se sua produção demora tanto que a informação de contexto associada fica desatualizada. Em outras palavras, é necessário buscar um processo de trabalho em que a soma das incertezas seja minimizada. Sim, pois incertezas se acumulam, e se propagam, na medida em que usamos dados carregados de incertezas em combinação com outros, que trazem incertezas de outros tipos, para produzir informação – e para nos ajudar a tomar decisões.

Neste sentido, fica fácil compreender a associação que existe entre incerteza e qualidade dos dados. Nos países desenvolvidos, tem-se tornado comuns as situações em que decisões políticas, administrativas ou judiciais utilizando bases de informação apenas são tomadas quando se tem uma noção precisa do grau de incerteza que existe nessas bases. Em conseqüência, os órgãos públicos e as organizações em geral responsáveis pela produção e disseminação de informação estão sendo levadas a aprofundar seu registro de incertezas, como meio de se resguardarem contra ações judiciais contestatórias da validade dos dados e também como recurso para garantir sua reputação enquanto fontes de informação.

Outro tipo de incerteza interessante em geoprocessamento, este ainda com um menor volume de estudos por parte da comunidade científica, refere-se à própria imprecisão e ambigüidade da linguagem humana. Ao usar a linguagem dita natural para se comunicar com seus semelhantes, estamos acostumados a encontrar todo tipo de imprecisões, muitas vezes resolvidas quando o interlocutor conhece o contexto da conversa. Pensando nisso, compreendemos porque é tão fácil transmitir a mensagem errada para outra pessoa, quando o contexto não está bem colocado, ou quando essa outra pessoa e seu interlocutor não compartilham de um conjunto de conceitos comuns, obtidos na vida cotidiana, sobre o tema do diálogo. Essa informação de contexto pode ser compreendida como uma forma de ontologia, e portanto existiria uma ontologia "básica", que nos permite interagir com qualquer pessoa que conosco compartilhe apenas o domínio da língua falada ou escrita.

Aplicando esta noção à informação geográfica, percebe-se que as referências que fazemos a lugares funcionam aproximadamente desta maneira. Ao dar indicações de rota a um conhecido, procuramos usar nomes de ruas e de referências que a pessoa possa reconhecer; para fazer o mesmo ao ajudar um turista, usamos referências mais vagas ("vire na terceira rua à direita"), para compensar a ausência do contexto comum, no caso o conhecimento geográfico sobre a cidade. Temos, em geral, recursos para nos referirmos a lugares de maneira formal – por exemplo, usando um endereço postal – e informal – por exemplo, indicando pontos de referência ou provendo referências mais genéricas, como o nome de um bairro. Este tipo de "imprecisão" nos ajuda a construir essas referências geográficas, pois nos dá ferramentas para reduzir o grau de incerteza que nosso interlocutor possa ter quanto aos locais que estamos citando. Assim, o que se busca são maneiras de fazer com que sistemas automatizados possam compreender referências a lugares com base em qualquer informação de contexto que esteja disponível. Esse tipo de solução seria de valor inestimável, por exemplo, para que máquinas de busca na Web possam permitir a localização de páginas referentes a um determinado lugar – e não apenas que citem certas palavras-chave em seu texto. Além disso, é necessário reconhecer e interpretar referências imprecisas a relacionamentos espaciais, encontradas em toda parte: algo do tipo "fica a cinco minutos do shopping", ou "próximo ao Centro de Convenções".

Todos nós, ao tomar contato com a tecnologia de geoprocessamento, um dia imaginamos que fosse possível ver respondida automaticamente uma consulta cheia de imprecisões, formulada em linguagem natural, a partir de um banco de dados cheio de lacunas e incertezas. Está finalmente iniciando a busca por uma solução.

Clodoveu Davis
Engenheiro Civil, Doutor em Ciência da Computação
Pesquisador da Prodabel Empresa de Informática e Informação do Município de Belo Horizonte
Professor da PUC-MG.
clodoveu.davis@terra.com.br