Síndrome do óculos para perto

A escolha correta da unidade
geográfica de análise é fator
crítico de sucesso em
estudos de mercado.

Conversando recentemente sobre a necessidade de agrupar dados relativos a setores censitários, lembrei-me de meu avô, óculos na ponta do nariz, braços meio estendidos, aproximando e afastando dos olhos um livro. O sucesso em formar foco era sempre acompanhado de um leve arquear de sobrancelhas, não sei se de exultação por finalmente enxergar o texto, ou alívio por não ter de voltar ao oftalmologista.

A análise de dados georreferenciados vai por aí: existe uma distância específica em que a resposta a um problema se oferece como imagem bem definida. Observada de muito perto ela se fragmenta; de muito longe, colapsa num borrão.

Considere, por exemplo, a proporção de idosos em uma região. É de se imaginar que os indivíduos de mais de 70 anos correspondam a uma proporção estável da população.

Mas se região for um domicílio com um único morador, a proporção de idosos ou é zero (o morador não é idoso) ou é 100% (o morador é idoso). Se o domicílio tiver dois moradores, a proporção de idosos pode ser zero, 50 ou 100%. E assim por diante. Como a maioria dos domicílios tem poucos moradores, há poucos resultados possíveis para a proporção de idosos, e a variabilidade de um domicílio para o outro é extremamente alta.

Dependendo do tipo de problema que estamos procurando resolver, uma abordagem neste nível de detalhe corresponderia a examinar o cartaz de um outdoor tão de perto que, em vez de uma imagem, veríamos apenas os pontos brancos ou pretos que a compõem. Mesmo numa unidade de análise mais abrangente, como setores censitários ou distritos municipais, o quadro pode continuar fragmentado, isto é, sem formar um padrão.

No gráfico abaixo, por exemplo, temos a população de idosos versus a população total dos distritos do município de São Paulo. Se os idosos fossem uma proporção fixa do total de habitantes dos distritos, estes pontos deveriam cair perto de uma reta (representada entre os pontos), cuja inclinação corresponderia à porcentagem de idosos. Examinando bem o gráfico, dá para notar uma leve tendência de aumento do número de idosos em populações maiores, o que causa a inclinação suave da reta. Mas este modelo linear explicaria apenas 12% da variabilidade total dos dados.

Conclui-se que, para o conjunto dos distritos do município de São Paulo, a população de idosos não é uma proporção estável da população total. Existem, por exemplo, distritos de diversos tamanhos entre 50 e 250 mil habitantes, todos com aproximadamente 3.000 pessoas com mais de 70 anos, de forma que podemos ver que estas duas grandezas são bastante independentes. Estranho, não? Contraria a intuição.

Por que isso acontece? Podemos supor que as condições de vida e o perfil sócio-econômico dos distritos influem sobre a expectativa de vida dos velhinhos. Se isso fosse verdade, não poderíamos englobar todos os distritos na mesma análise – seria como misturar na mesma conta frutas de diferentes qualidades. Ninguém esperaria encontrar a mesma expectativa de vida na Bélgica e na Índia.

Assim, resolvemos separar os distritos em grupos homogêneos, com base em indicadores de qualidade de vida, autonomia e nível de instrução da população. Surpresa: se adotamos três grupos, a segmentação baseada apenas nas variáveis escolhidas indica claramente a estrutura centro / anel intermediário / periferia.

O grupo de distritos verdes corresponde à área aproximadamente central do município e caracteriza-se por excelentes condições de vida. Estas decaem um pouco no anel intermediário (pintado de amarelo) e degradam-se rapidamente na região da periferia (extremos vermelhos da cidade). Mantendo a convenção de cores e retomando o diagrama de dispersão inicial, temos agora a seguinte situação:

Os pontos correspondentes aos distritos centrais agora aproximam-se bastante da reta verde; e os pontos da periferia seguem de perto a reta vermelha. Isto significa que os velhinhos correspondem a aproximadamente 6% dos moradores dos bairros nobres e apenas 1% dos moradores da periferia. Embora cruel, esta explicação dá conta respectivamente de 70% e 80% da variabilidade total dos dados em cada região.

Deixei o grupo de distritos intermediários sem reta no gráfico, porque ele ainda não está bem resolvido. Nota-se que poderiam ainda ser subdivididos em dois segmentos: parece persistir uma mistura de distritos diferenciados. Mas ficamos por aqui. Esta análise basta ao nosso argumento:

observada muito de perto, a proporção de idosos pode ser qualquer coisa ente zero e 100%.;

 no outro extremo, se tomamos o município de São Paulo como um todo, a proporção encontrada de 3% esconderia o fato que, na verdade,

nos bairros centrais a população de maiores de 70 anos é de 6% da população, contra 1% na periferia.

Agora que os dados de setores censitários do Estado de São Paulo estão disponíveis em CD-ROM (diretamente do IBGE) e que a empresa de mapas GDT promete para até o final do ano os respectivos contornos, os marqueteiros precisam ir acostumando a vista.

Francisco Aranha é professor da Escola de Administração de Empresas de São Paulo, da Fundação Getúlio Vargas (Eaesp/FGV), e consultor em Marketing Geográfico pela Paredro Administração (SP).
email:faranha@ibm.net.