Segmentação com mapas neurais de kohonen
Em essência, Redes Neurais são uma tecnologia de processamento de informações que se inspira no funcionamento do cérebro humano. Apresentadas a uma série de estímulos (os dados a analisar) as redes neurais os organizam e aprendem a reconhecer padrões e fazer previsões. Se recebem informações sobre a magnitude e direção dos erros que cometem na análise, aperfeiçoam seu conhecimento, melhorando as respostas seguintes. Devido à habilidade das redes em modelar dados com rapidez e flexibilidade, seu uso já está razoavelmente generalizado em organizações de pesquisa e ensino; empresas e governo estão se iniciando no assunto.
O caminho percorrido no desenvolvimento da tecnologia foi longo. Das primeiras idéias sobre como os sistemas biológicos aprendem, na década de 30, à disseminação dos aplicativos para computadores pessoais, neste final dos anos 90, houve desvios de rota, caminhos sem saída, retrocessos, desacelerações e retomadas. Recentemente, no entanto, avanços na teoria e o desenvolvimento de interface amigável permitiram o desenvolvimento de um grande número de aplicações comerciais de baixo custo e fácil implementação. Dentre estas, destaca-se, na área de segmentação de mercado, a utilização dos mapas auto-produzidos em redes de Kohonen.
Como todas as redes neurais, as de Kohonen são formadas por um conjunto de elementos simples, chamados neurônios, organizados em estruturas mais complexas, que funcionam em conjunto: a rede. Cada neurônio é uma unidade de processamento que recebe estímulos (de fora do sistema ou de outros neurônios), e produz uma resposta (para outros neurônios ou para fora do sistema). Tal como os neurônios do cérebro, os das redes neurais são interligados entre si por ramificações através das quais os estímulos são propagados. O processo de aprendizado consiste em reforçar as ligações que levam o sistema a produzir respostas mais eficientes.
O que distingue as redes de Kohonen das demais é uma estrutura em duas camadas: uma de entrada e outra de processamento, onde se forma o mapa. A camada de processamento é formada por um grid de neurônios equiespaçados conectados apenas aos seus vizinhos imediatos.
Os objetos a ser agrupados para subseqüente segmentação (por exemplo, os clientes de uma determinada loja) são apresentados, um por vez, aos neurônios de entrada. A cada apresentação, os estímulos gerados pelo objeto (por exemplo, características dos clientes quanto a freqüência de visitas, ticket médio, linha de produto adquirido, etc.) são capturados pela camada de entrada e transmitidos igualmente a todos aos neurônios da camada do mapa.
No mapa, o neurônio que reagir mais fortemente aos estímulos do objeto apresentado ganha-o para si. Além disso, reforça suas ligações com os vizinhos próximos, sensibilizando-os um pouco mais às características do objeto capturado.
Numa próxima oportunidade, quando um objeto parecido for apresentado ao mapa, toda a região sensibilizada reagirá um pouco mais intensamente. Por outro lado, como os neurônios vizinhos são diferentes do neurônio ganhador, cada um reagirá mais intensamente a um objeto um pouco diferente.
A cada nova apresentação de um objeto ao mapa, o perfil de sensibilidade dos neurônios vai se alterando: isto é o que chamamos de treinamento da rede. Estas alterações, no entanto, são cada vez menores, de forma que a configuração do mapa converge para uma disposição estável. Quando isto acontece, dizemos que o mapa aprendeu a classificar indivíduos.
O resultado do processamento de uma rede treinada é que cada neurônio torna-se dono de um certo número de objetos, parecidos com os capturados pelos neurônios vizinhos. Desta maneira, os indivíduos semelhantes vão sendo posicionados próximos entre si, formando um gradiente de características
Uma vez organizados os indivíduos, resta separar os agrupamentos, isto é, definir as fronteiras entre os segmentos. Nesta etapa final, costumo utilizar um Sistema de Informações Geográficas: cada neurônio da rede de Kohonen é traduzido no GIS como um ponto definido pelo cruzamento das linhas do grid. A estes pontos associo:
O número de objetos capturados pelo neurônio. Com base nesta informação, construo um relevo sobre o grid, em que alto significa alta densidade de objetos nas imediações do ponto e baixo significa baixa densidade de objetos nas imediações do ponto. As fronteiras que delimitam os agrupamentos são traçadas preliminarmente segundo as curvas de nível de baixa densidade, isto é, nos vales que separam os morros de objetos parecidos.
O grau de semelhança da intensidade de reação dos neurônios a um objeto típico dos agrupamentos formado no passo anterior. Isto é: seleciono um objeto típico do pico de um morro do relevo formado e o reapresento à rede neural; embora o neurônio sob o pico tenha ganho este objeto porque é quem reage mais fortemente a ele, os neurônios vizinhos podem também reagir muito fortemente (o grupo é coeso) – ou não (o grupo é pouco coeso). Esta informação é traduzida em um novo relevo de intensidade de reação de toda a rede em relação a cada pico do mapa anterior.
Com base nestas informações de relevo de número de indivíduos e intensidade de semelhança entre eles, combinadas a um pouco de análise estatística convencional (por exemplo para definir o que é um indivíduo típico dos posicionados num mesmo morro, etc.) podemos refinar o estabelecimento das fronteiras entre os segmentos e interpretar o significado dos grupos.
Se você se interessou por conhecer um pouco mais sobre redes neurais em geral, e mapas de Kohonen em particular, tenho duas dicas:
Sugiro que você baixe uma apresentação chamada de Neurobook II, disponibilizada na página do SPSS relativa ao software Neural Connection (http://www.spss.com/software/Neuro/), que é bastante interessante.
Além disso, o livro BEALE, R. e JACKSON, T, Neural Computing: An introduction, London: Institute of Phisics Publishing, 1997, cobre as idéias básicas do tema, é de leitura acessível e clara, e fornece a descrição de algoritmos que podem ser implementados até em planilhas de Excel, ajudando muito na compreensão dos princípios de funcionamento das redes.
Francisco Aranha é professor da Escola de Administração de Empresas de São Paulo, da Fundação Getúlio Vargas (Eaesp/FGV), e consultor em Marketing Geográfico pela Paredro Administração (SP).
email:faranha@ibm.net.