Coloma, Califórnia, início de 1848. James Marshall recolhe pepitas de ouro do Rio Americano, ao lado de um moinho em construção. Em agosto, 4.000 mineiros estão acampados em cabanas nas encostas de um morro próximo. Até o final do ano, mais 40.000 pessoas chegam a São Francisco por mar; outras 40.000 por terra, em caravanas, enfrentando índios e cólera. O trabalho é duro, os preços, elevados, e as condições de vida, primitivas. Poucos ficam ricos. Muitos encontram a morte.

Guardadas as proporções, neste final de década estamos presenciando uma nova corrida do ouro, agora no ambiente empresarial. A imagem escolhida não por acaso foi a de mineração: data warehousing (concentração de dados em grandes depósitos magnéticos) e data mining (prospecção, automatizada ou semi-automatizada, destes dados) encaixam bem num cenário de desbravadores.

O ambiente para este fenômeno é preparado por 3 forças convergentes:
 novas tecnologias de informática, como as emprega-das na construção dos data warehouses, permitem a manipulação de grandes massas de dados a custos razoáveis e declinantes;
 aumento de competição, causado pela globalização, obriga as empresas a segmentar sua clientela e ampliar suas áreas geográficas de atuação;
 uma mudança de paradigma no marketing leva as empresas a privilegiar o relacionamento individualizado com seus clientes.

O folclore disseminado pelas consultorias e revistas de negócios incentiva ainda mais a corrida. Uma história muito popular é da cadeia varejista americana que teria reunido seus dados de ponto de venda num data warehouse gigantesco, colocado os discos para rodar e feito uma descoberta extraordinária: há alta correlação entre vendas de fraldas e de cervejas. A reorganização das gôndolas, com colocação lado a lado de Pampers e Bud Lights, teria feito as vendas disparar. Foi dada a largada. Para alegria de fornecedores de hardware e software, a maioria das empresas está correndo em busca dos data warehouses.

Mas há histórias tristes. A American Express, segundo informações publicadas na edição de abril de Forbes, investiu mais de U$ 30 milhões na criação de depósito de dados para divisão de serviços ligados a viagens. Os resultados foram desapontadores. Com o novo sistema pode-se, por exemplo, identificar portadores de cartão que fazem gastos elevados com equipamentos de esqui, mas não se pode acompanhá-los para testar modelos de previsão de comportamento de compra. A arquitetura do depósito está errada.

A divisão de marketing direto da J.C. Penney investiu U$ 4 milhões em um data warehouse para poder estimar o potencial de compra de seus clientes, mas problemas com o projeto do banco de dados impossibilitaram que 80% dos clientes tivessem seu potencial avaliado.

Isso não significa que data warehouses não devam ser implementados: apenas revela que a empreitada – fascinante – é arriscada. E cara. A principal restrição ao sucesso é humana. É difícil prever com segurança os tipos de informação de que vamos necessitar no futuro. Desenhar estruturas de dados ao mesmo tempo flexíveis e eficientes é trabalho extremamente complexo e requer expertise.

Mesmo que as informações estejam disponíveis, 80% do esforço de prospecção acabam, obrigatoriamente, sendo dedicados a consolidação, limpeza, validação e enriquecimento dos dados, trabalho pouco glamouroso que desanima mesmo o mercadólogo mais entusiasmado. Os restantes 20% do serviço requerem mais expertise.


Pesquisa, Seleção e Avaliação de Ponto Comercial.
Quadro adaptado de Business Geographics (May 1998)

Envolvem técnicas estatísticas não triviais – hoje empacotadas em celofane novo e rebatizadas de ferramentas de data mining, mas essencialmente as mesmas técnicas estudadas nas últimas duas décadas, e que requerem especialistas para manuseio correto. Software e hardware já não representam problemas – exceto, talvez, pelo preço.

A boa notícia é que, dando tudo certo, os data warehouses incorporam as ferramentas de mining e de GIS e potencializam os resultados do suporte ao marketing de relacionamento. Há muito conhecimento e potencial de lucro adormecido nos bancos de dado. Quando se encontra um veio, todo esforço é mais do que recompensado.

Neste contexto, o data warehouse funciona como eixo organizador de dados provenientes da operação da empresa, do seu departamento de pesquisas de mercado, de fontes de dados sócio-demográficos e econômicos, de modelos de segmentação espacial por estilo de vida e dos demais dados adquiridos de terceiros. Os departamentos de pesquisa de mercado, de compras e suprimentos e de avaliação de pontos comerciais tornam-se tanto usuários quanto fornecedores das informações ali depositadas. No coração do sistema, ferramentas de GIS e data mining, acopladas a indispensável modelo estatístico espacial, produzem as pepitas tão cobiçadas. Sim: esta mina também produz histórias de sucesso.

O uso de depósito de dados contendo 18 meses de movimentação das contas de seus clientes, permitiu ao Banco Itaú reduzir seus gastos de correio para 1/5 e aumentar o retorno de suas campanhas de mala direta de 2% para 30%, segundo matéria da revista Exame de 09/04/97. Na mesma reportagem, ficamos sabendo que a Golden Cross colocou, com sucesso, a ficha médica de seus clientes em um warehouse cuja utilização permitiu diminuir cancelamentos de contratos, acompanhar despesas com médicos e fornecedores e evitar fraudes.

Se você trabalha com marketing ou GIS, mais cedo ou mais tarde vai se envolver nesta aventura. Pode abrir o mapa e começar a escolher seu roteiro. Uma boa maneira de começar é pensando pequeno. Com apenas um microcomputador, softwares de bancos de dados, GIS e estatística, dedicação e muita boa vontade, projetos pilotos podem ser implementados. Os benefícios desta abordagem são o menor custo, a alavancagem do aprendizado dos envolvidos e maior facilidade de redirecionamento, em comparação com estratégias que exigem implantação de grandes estruturas. A dificuldade é que, não podendo trocar conhecimento estatístico por força bruta de computação e enormes massas de dados, o analista deve conhecer um mínimo a respeito de amostragem. Isso provavelmente implica algum estudo adicional, mas certamente vale a pena.

Francisco Aranha é professor da Escola de Administração de Empresas de São Paulo, da Fundação Getúlio Vargas (Eaesp/FGV), e consultor em Marketing Geográfico pela Paredro Administração (SP). email:faranha@ibm.net.