Abstrações e generalizações
Mapas são mentiras, mas precisam de qualidade
Segundo Mark Monmonier, em seu livro How to Lie With Maps (Como Mentir com Mapas), não é apenas fácil mentir com um mapa, é essencial. De forma bem humorada, o autor defende que um mapa apresenta informações altamente complexas sobre realidade, inter-relacionadas e tridimensionais. Todavia, o mapa é escalonado, geralmente apresentado de forma bidimensional e precisa ser seletivo e objetivo com as informações apresentadas. Em outras palavras, o mapa omite a verdadeira complexidade do que ele representa sobre o mundo real.
Ainda neste cenário, todas as informações geográficas são diretamente ou indiretamente medidas por meio de instrumentos que introduzem algum nível de imprecisão como, por exemplo, sensores remotos e aparelhos de GPS.
Em suma, o mapa é uma visão incompleta e imprecisa da realidade. Logo, nas palavras de Monmonier, contém mentiras. Assim, o autor expõe o paradoxo da cartografia: para se ter uma útil e confiável representação da realidade, um mapa acurado precisa distorcê-la e simplificá-la.
Por exemplo, para representar o modelo da Terra em duas dimensões, como em papel ou na tela do computador, é necessário utilizar uma projeção cartográfica, que sempre distorce geometricamente as informações referenciadas sobre a superfície da Terra.
Há projeções que preservam certas propriedades geométricas (áreas, linhas, ângulos), o que direciona as suas aplicações práticas. Observe nas imagens a seguir o mesmo dado geográfico, com os países do mundo sobre duas projeções cartográficas distintas: Robinson e Policônica. Na primeira, a área calculada do Brasil é de 7.001.856 quilômetros quadrados, enquanto na segunda temos 11.907.477 quilômetros quadrados. Segundo a Resolução 05/2002 do Instituto Brasileiro de Geografia e Estatística (IBGE), a área oficial do Brasil é de 8.514.877 quilômetros quadrados. Ressalta-se que a diferença entre as áreas calculadas para a área oficial não se deu somente pela imprecisão do limite do Brasil no dado geográfico, mas principalmente pela deformação induzida pela respectiva projeção.
Os elementos do mundo real podem ser representados geograficamente de maneiras distintas, de acordo com o objetivo do projeto. Por exemplo: uma cidade pode ser representada por um ponto da sua sede ou um polígono do seu limite urbano; um rio pode ser apresentado por um polígono delimitando suas margens ou uma linha representando seu fluxo; o relevo da área de estudo pode ser expresso por uma matriz de valores (raster) ou pontos cotados e isolinhas.
Os atributos descritivos coletados também dependem da visão do observador como, por exemplo, a classificação de áreas de favelas de uma cidade ou os tipos de vegetação podem mudar de acordo com a instituição que produz os dados, pois as metodologias empregadas são diferentes e baseadas, muitas vezes, em processos de interpretação humana.
Qualidade de dados geoespaciais (ou o tamanho da mentira)
A ideia que Mark Monmonier em seu livro apresenta tem grande relação com a qualidade dos dados geográficos: dizer o quanto, onde e porque você está mentindo. Seja por meio de metadados, relatórios ou outros instrumentos, é preciso planejar e informar como se dá a representação simplificada e distorcida da realidade no contexto do dado geográfico: o que está sendo representado, qual a metodologia utilizada, qual a precisão posicional, temporal e dos atributos medidos, quais relacionamentos entre os elementos são garantidos, entre outros. Qualquer variação desses fatores implica em outra versão na representação da realidade, o que obviamente determina as aplicações cabíveis daquela informação aos projetos.
Afinal, não são mentiras quando um aparelho de GPS veicular informa a mão da rua invertida? Ou quando se vai a campo buscando um poço artesiano e ele está a 200 metros de onde o mapa aponta? Ou mesmo quando o atributo de um arquivo shapefile adquirido publicamente em um site diz que uma instalação está no Estado do Pará, mas seu ponto geográfico está meio do Estado de Tocantis?
Uma enquete recente no Portal da MundoGEO continha a seguinte pergunta: “Qual fase mais influencia na qualidade de dados espaciais?”. Dos participantes, 73% responderam que é a de coleta. Esta fase acontece quando se mede o que se deseja representar sobre o mundo real, simplificando e introduzindo as primeiras imprecisões. Se essa etapa não seguir as especificações necessárias aos padrões de qualidade estipulados, geralmente é necessário realizar uma nova coleta.
Outros 12% dos participantes elegeram a fase de integração como a mais importante. Uma vez que é cara e demorada a coleta dos dados, e existe uma crescente política de disponibilização de dados internamente nas instituições ou de forma pública, se torna mais comum ações de integração de dados geográficos. Todavia, ainda há carência de padrões e controle mais claro de qualidade do que é disposto pelas fontes, o que torna esta fase complexa e falha. Se o dado disponível não possuir a representação desejada da realidade, com as distorções dentro de limites toleráveis ao projeto, o dado não é útil ao mesmo. Na integração de diversos dados, ainda é necessário considerar se as representações da realidade são compatíveis entre si. Por exemplo: realizar um estudo temporal de cobertura vegetal com dois dados geográficos nos anos de 1990 e 2000, porém com a classificação de tipos de vegetação não padronizada.
Nesse contexto, pode até ser considerado pouco o fato de apenas 8% dos participantes da pesquisa terem escolhido a fase de padronização como a mais importante. Sem padronização na representação da realidade, pode se tornar impossível a integração de dados. Na prática, percebe-se que os usuários forçam a integração, realizando edições que comprometem ainda mais a qualidade final do resultado. Entretanto, cabe ressaltar que um padrão não atende a todas as finalidades possíveis de qualquer projeto.
Por fim, 6% dos participantes elegeram a fase de modelagem como a mais importante, o que também pode ser considerado pouco. Apesar da realidade representada pelos dados geográficos ser parcial e distorcida, ela não é necessariamente simples. As técnicas de modelagem que apresentam recursos para uma representação sistêmica e inteligível de sistemas complexos como, por exemplo, modelos de banco de dados. Observando que a modelagem pode existir já no planejamento do projeto, a mesma pode influenciar em qualquer uma das outras fases citadas na pesquisa do Portal MundoGEO: coleta, integração e padronização.
Sendo assim, ao gerarmos dados geográficos, precisamos definir e comunicar ao usuário como se deu a nossa representação da realidade, descrevendo as informações apresentadas e as distorções envolvidas. Quando utilizamos dados de fontes externas, precisamos nos ater sobre compatibilidade das representações com os objetivos do nosso projeto. Ao integrarmos dados geográficos, precisamos também verificar a mesma compatibilidade, caso contrário o resultado da integração pode ser comprometido.
Já existem instrumentos para definição e comunicação de como o mundo real está representado pelo dado geográfico. Este assunto é discutido há algum tempo pela comunidade da área e nas universidades. Porém, apesar da melhoria gradual, na prática ainda se percebe uma falta desses instrumentos como, por exemplo, modelos de dados, padrões, metadados, relatórios de controle de qualidade, dicionário de dados, entre outros.
Já que são as mentiras que garantem a utilidade dos mapas, precisamos contar onde as mentiras estão, de forma que não sejamos pegos desprevenidos. Desta forma, podemos controlar e informar a qualidade dos dados geográficos.
José Augusto Sapienza Ramos
Bacharel em ciência da computação, professor dos cursos de extensão em geotecnologias e pesquisador associado do LABGIS/UERJ, consultor na Sinapse Geotecnologias