Como mentir com mapas (sem o saber...)

É preciso saber o quanto se mente ao gerar um mapa e encontrar maneiras de superar o problema

O título do artigo é uma menção deliberada ao livro "How to Lie with Maps", de Mark Monmonier, excelente apresentação sobre diferentes técnicas de construir mapas com o intuito de confundir, enganar ou desinformar. O livro reúne um conjunto de exemplos extremamente didáticos de mentiras com mapas, algumas sutis e outras deslavadas. Como mostra Monmonier, os componentes essenciais de um mapa (escala, projeção e apresentação visual) envolvem sempre um grau de arbitrariedade em sua escolha. Assim, sempre estamos mentindo ao gerar mapas; a questão é sabermos quanto, e informarmos ao leitor.

Se o livro de Monmonier aborda e apresenta vários exemplos de mapas projetados deliberadamente para enganar, gostaríamos aqui de discutir uma situação menos óbvia: o auto-engano, ou seja, a situação em que produzimos mapas que induzem a leituras errôneas, sem nos dar conta das imprecisões que estamos cometendo. Um caso particularmente problemático diz respeito ao tipo de mapa mais freqüentemente produzido pelos usuários de um GIS: o mapa com áreas preenchidas com valores. Num mapa como esse, dito coroplético, um valor numérico médio sobre algum aspecto de uma área (por exemplo, densidade populacional por município) é indicado numa escala de cores ou de padrões gráficos.

Consideremos a Figura 1, que apresenta um mapa coroplético com a mortalidade infantil dos bairros do Rio de Janeiro, em 1994.

Figura 1 – Mapa da taxa de mortalidade infantil dos bairros do Rio de Janeiro, 1994, agrupados em 5 intervalos. Note-se o efeito visual produzido pelos valores extremos (bairros com taxas maiores que 40 óbitos por mil nascidos ou menores que 10 por mil nascidos).

Neste mapa, o Rio está dividido em 148 bairros, e dispomos da taxa de mortalidade infantil anual para cada bairro, expressa em número de crianças mortas até 1 ano do nascimento, por grupo de mil nascidos. No mapa, dividimos a variação em 5 partes, e associamos cada parte a uma cor.
Numa primeira leitura, este mapa choca pelas altas taxas de mortalidade de vários bairros, com 15 bairros apresentando uma taxa maior que 40 óbitos por mil nascidos, e 2 casos com taxas acima de 100 por mil nascidos. Um observador desavisado poderia concluir que todos esses bairros apresentam um grave problema social. Na realidade, muitos desses valores extremos ocorrem nos bairros com pequenas populações, pois a divisão da cidade utilizada esconde enormes diferenças na população em risco, variando de 15 até 7500 crianças por bairro. Por exemplo, considere uma região com 15 crianças nascidas e nenhuma morte, o que aparentemente indicaria uma situação ideal. Se apenas uma criança morre neste ano, a taxa passa de 0 por mil para 66 por mil !

No dizer do prof. Renato Assumpção (UFMG): "O que mais chama a atenção num mapa coroplético (os valores extremos), é o menos confiável. As maiores oscilações não estarão, em geral, associadas com variações no risco subjacente; serão apenas flutuação aleatória casual."

O que fazer? Resignar-se a apresentar um mapa que sabemos enganoso? Não, o correto é munir-se de suporte científico para procurar estimar, para as regiões com pequenas populações, uma taxa mais próxima do risco real à qual a população está exposta. Para isso, a primeira providência é fazer um gráfico que expressa a taxa em função da população em risco (Figura 2).

Figura 2 – Gráfico da taxa de mortalidade infantil por população de cada bairro do Rio de Janeiro.

No caso do Rio, a taxa média de mortalidade infantil da cidade, em 1994, foi de 21 óbitos por mil nascidos. Neste gráfico, observamos que os bairros com maior população apresentam taxas próximas da média da cidade. Conforme diminui a população em risco, aumenta muito a flutuação da taxa medida, formando o que já foi denominado de "efeito funil" (Renato Assumpção). Nos bairros de menor população, essa variação oscilou de 0 a quase 130 por mil. Para resolver esse problema de instabilidade das taxas em regiões com população reduzida, precisamos estimar uma taxa mais "realista", que reflita melhor o fenômeno do que o valor medido, que pode ser simplesmente "ruído aleatório".

Uma abordagem possível é supor que as taxas das diferentes regiões estão relacionadas, e levar em conta o comportamento dos vizinhos para estimar uma taxa mais realista para as regiões de menor população. As regiões terão suas taxas re-estimadas aplicando-se uma média ponderada entre o valor medido e a taxa média global, em que o peso da média será inversamente proporcional à população da região. Regiões com populações muito baixas terão uma correção maior, e regiões populosas terão pouca alteração em suas taxas.

Ao utilizarmos essa correção às taxas de mortalidade infantil do Rio de Janeiro, observamos que há uma redução significativa nos valores extremos. Por exemplo, a Cidade Universitária (Ilha do Fundão), onde nasceram 13 crianças em 1994, apresentou uma taxa aparente de 76 por mil e uma taxa corrigida de 36 por mil. Bairros com pouca população no grupo de risco apresentaram reduções semelhantes, enquanto que bairros mais populosos mantiveram as taxas originalmente medidas. A comparação entre a taxa primária e o valor estimado está apresentada na Figura 3. Finalmente, na Figura 4, apresentamos o mapa coroplético das taxas estimadas, com a mesma legenda do mapa anterior. Também se verifica uma redução nos valores extremos e uma apresentação mais confiável da realidade.

Figura 3 – Comparação entre taxas de mortalidade aparentes (eixo Y) e estimadas (eixo X). Note-se a redução das taxas para os valores extremos.

Figura 4 – Taxas de mortalidade infantil estimadas para o Rio de Janeiro, 1994. Note o efeito de redução dos valores extremos (menores que 10 e maiores que 40 por mil), se comparado com a Figura 2.

Em resumo, é preciso extremo cuidado ao produzir mapas coropléticos, especialmente em casos onde apresentamos taxas medidas sobre populações muito diferentes, como no exemplo mostrado. Apesar do mapa resultante aparentemente ser fiel aos dados, estaremos promovendo uma apreciação indevida da realidade. As ferramentas simples de operar disponíveis nos principais "desktop GIS" têm um preço: nem sempre paramos para pensar sobre o que realmente estamos produzindo. E, como diz Edward Tufte, autor de trabalho excepcional sobre o tema ("The Visual Display of Quantitative Information"), "os gráficos e mapas devem mostrar a variação dos dados, não as capacidades do programa de computador."

Agradecimentos
O autor agradece à profa. Marília Sá Carvalho, da FIOCRUZ, pela cessão dos dados, melhor discutidos no trabalho "Perfil de nascimentos no Município do Rio de Janeiro: uma análise espacial", de E. dOrsi e M. S. Carvalho, Cadernos de Saúde Pública, 1998 (disponível no website http://www.procc.fiocruz.br/~marilia ). A contribuição e as idéias do prof. Renato Assumpção (UFMG), e da dra. Suzana Cavenagh (NEPO/UNICAMP) foram fundamentais para melhor conceituar as idéias aqui apresentadas. Para maiores detalhes técnicos sobre as técnicas apresentadas neste artigo, veja o material disponível no site http://www.dpi.inpe.br/gilberto/livro.

Gilberto Câmara
é coordenador de Pesquisa e Desenvolvimento em Geoprocessamento do INPE, sendo um dos responsáveis pelos sistemas SGI e SPRING (www.dpi.inpe.br/gilberto).