Bibliotecas de dados na Internet facilitam o gerenciamento de dados geográficos. Descubra neste artigo o que é necessário para construir uma.

por Reinaldo Chohfi Escada

O gerenciamento de grandes bancos de dados espaciais contendo arquivos raster e vector é problema presente em firmas e instituições que trabalham com GIS, cartografia digital, modelos de terreno digital, fotografias aéreas e imagens de satélite digitais. Esses bancos podem facilmente chegar a terrabytes, acarretando problemas não só de armazenamento mas também de organização, acesso, recuperação, visualização e distribuição dos dados.

A implementação de uma mapoteca digital pode resolver a maior parte destes problemas. Este artigo descreve o modelo empregado em várias mapotecas digitais, ilustra exemplos e cita possíveis aplicações.

Iniciativa de Bibliotecas Digitais
O governo federal dos EUA tem dado muita importância ao projeto da Infra-Estrutura Nacional de Informação (NII), que visa levar aos americanos conhecimento e informação via Internet. Um projeto chamado Iniciativa de Bibliotecas Digitais (DLI: http://dli.grainger.uiuc.edu/national.htm) fez avançar dramaticamente os meios de coleta, armazenagem e organização de informação em formato digital. Foi proporcionado acesso da informação por busca, recuperação e processamento via redes de comunicação com interface amigável ao usuário.

A DLI foi financiada por 3 agências federais americanas: Fundação Nacional de Ciência (NSF); Agência de Projetos de Pesquisa Avançados (ARPA) do Departamento de Defesa; e NASA. Seis projetos de bibliotecas digitais foram financiados neste programa. Cada um recebeu aproximadamente US$ 1 milhão por ano durante 4 anos para pesquisas e projetos pilotos. Dos 6 projetos, 2 se dedicaram exclusivamente a criar mapotecas digitais.

Modelo de Mapotecas Digitais
Diferentes computadores, equipamentos e software são necessários para formação de uma mapoteca. A configuração básica varia entre as diferentes instalações. O modelo é baseado no uso da Internet ou Intranet com arquitetura de cliente/servidor para distribuição de dados, via protocolos FTP e/ou HTTP.

Computadores e equipamentos instalados nas principais mapotecas digitais incluem:
 Estação de trabalho Unix (high-end workstation),
 Array de discos rígidos (Fast Wide SCSI) e/ou CD-ROMs,
 Robô de fitas magnéticas (jukebox), e
 Computador pessoal do tipo PC.


Configuração básica de uma mapoteca digital.

O software usado também varia, porém são necessários os seguintes elementos:
 Sistema operacional Unix,
 Servidor da World Wide Web (WWW) capaz de fazer transações seguras,
·Navegador WWW (browser),
 Cliente do robô de fitas magnéticas,
 Linguagens de programação: C/C++, Common Gateway Interface (CGI), HyperText Markup Language (HTML), Java, e Perl,
 Sistema de gerenciamento de banco de dados relacional (RDBMS) ou orientado a objeto (OODBMS),
 Software de processamento de imagens,
 Software de GIS, e
 Software para compactar os dados.

Não existe pacote que se compre e instale para criar uma mapoteca digital; precisa-se escrever vários programas e scripts para isso. Uma lista típica pode ser encontrada em http://badger.parl.com/sysdoc/.

Como o modelo é baseado na Internet torna-se necessário criar um WWW site, o que envolve criação de interface para recuperação de dados. O processo de seleção dos dados a ser recuperados pode ser simples, como uma página com ícones ou links. Um sistema de queries espaciais existe por trás das interfaces mais elaboradas. Os seguintes métodos de queries devem ser avaliados:
 Textual,
 Ponto-no-polígono,
 Regional,
 Distancia, proximidade, buffer zone,
 Caminho (Path), e
 Onde é? e O que é?

As queries são processadas por RDBMS ou OODBMS, mesmo que a informação seja enviada ao sistema via formulários ou gráfico de navegação espacial da interface do WWW site.

O último elemento da mapoteca digital é um banco de dados geográficos. Geralmente é composto de mapas digitais raster e/ou vector, layers de GIS, modelos de terreno digitais (MTD), fotografias aéreas digitais (verticais e obliquas), imagens de satélite, e textos descritivos ou fotografias digitais sobre flora, fauna e meio ambiente. Também deve conter metadados de cada arquivo, que devem residir no RDBMS ou OODBMS. Considerações técnicas sobre organização do banco de dados geográficos incluem:
 Resolução espacial e temporal,
 Escala e projeção dos mapas,
 Idade dos dados,
 Qualidade e integridade dos dados,
 Manutenção do banco de dados,
 Formatos do metadado,
 Formatos dos arquivos de GIS,
 Escolha de layers a ser incluídos,
 Controle de acesso devido a diferentes níveis de licença dos dados, e
 Criação de proteção e autenticação com senhas.

Gerenciamento, recuperação e distribuição de um grande banco de dados geográficos são facilitados se computadores, equipamentos e software estão instalados conforme o modelo de uma mapoteca digital. A estação Unix é usada para rodar o servidor WWW, sistema de query espacial, RDBMS ou OODBMS, e os programas e scripts desenvolvidos para a interface entre os diferentes sistemas. A residência da WWW site é localizada e mantida com a mesma estação. A array de discos rígidos e/ou CD-ROMs armazenam os arquivos do banco de dados geográficos que formam a base de dados, e aqueles que são requisitados com maior freqüência. O robô de fitas magnéticas contém os maiores arquivos e os requisitados com menor freqüência, sendo também utilizado para fazer automaticamente backup periódico do sistema.

Exemplos de Mapotecas Digitais
As mapotecas digitais dos EUA diferem em termos do tipo de interface, presença ou não de um sistema de query espacial (spatial query engine) com RDBMS ou OODBMS, cobertura e volume do banco de dados geográficos, nível de acesso ao banco de dados, e tipo da distribuição dos dados (comercial ou acadêmica). Como a maioria das mapotecas analógicas, que não permitem a retirada de mapas pelos usuários, várias mapotecas digitais também não permitem a transferência dos arquivos. Os exemplos aqui citados variam de um sistema simples até o mais completo.

Na Universidade da Califórnia de Los Angeles (UCLA) temos um exemplo de sistema simples. O UCLA GIS Database Library distribui dados geográficos no campus para uso exclusivo de professores, pesquisadores e estudantes. O banco de dados usado contém 35 layers de GIS abrangendo todo o Estado da Califórnia e 10 imagens Landsat TM que totalizam 11 GB.


Imagens Lansat estão disponíveis no UCLA GIS Database Library

Uma página da web bastante simples leva o usuário através de dois links à pagina de dados GIS ou à do Landsat. O formato usado na distribuição dos layers de GIS é .e00, do Arc/Info. Os dados são distribuídos em arquivo tar, com metadado e script em linguagem Arc Macro Language (AML) do Arc/Info para conversão do arquivo para coverage. Não é possível fazer query espacial, navegação gráfica nem visualizar os arquivos antes da transferência. Interface mais elaborada está sendo implantada na Fase II do projeto.

O hardware usado inclui estação de trabalho Unix IBM RS/6000 com 2 GB de disco para armazenagem de arquivos online, IBM Magstar 3494 Tape Library Data Server (robô de fitas magnéticas) com 10 fitas de 30 GB cada uma, e rede do campus (Backbone Network). O robô de fitas é o ambiente principal para armazenamento e recuperação do banco de dados geográficos.

A mapoteca da Universidade da Califórnia de Berkeley (UCB), Electronic Environmental Library, nos leva a outro nível de interface, processamento e tipo de dados geográficos. Qualquer usuário pode ter acesso a esta mapoteca que, apesar de cobrir apenas a região norte da Califórnia, tem banco de dados bem mais profundo. Uma coleção de dados ambientais com documentos, fotografias aéreas e de habitats, dados geográficos e botânicos, totalizando mais de 600 GB, é disponibilizada por meio de interface Java Applet. É possível fazer queries, processadas por RDBMS, através de formulário. Várias fotografias aéreas do norte do estado também podem ser analisadas. Apesar de sua sofisticação, esta mapoteca não permite transferência de dados.


A Electronic Environmental Library da Universidade de Berkeley permite queries via formulário.

Na Universidade da Califórnia de Santa Barbara encontramos a mapoteca digital mais elaborada e completa dos EUA, a Alexandria Digital Library (ADL) Seu desenvolvimento foi baseado em três sistemas principais: RDBMS da Sybase; linguagem de script e ferramenta de interface Tcl/Tk; e software ArcView. O banco de dados é formado de texto, mapas, imagens de satélite, fotografias aéreas digitais e dados sobre terremotos e vulcões. É mantido um sistema de banco de dados espacial indexado, igualmente distribuído. O armazenamento é feito com 150 GB em disco magnético e óptico (CD-ROM) na Biblioteca de Mapas e Imagens (MIL), e aproximadamente 500 GB no robô de fitas magnéticas do Centro de Supercomputação em San Diego. O RDBMS reside em estação Unix RS/6000 localizada na central de computação da Universidade. Está previsto link com o banco de dados da mapoteca digital de Berkeley. O acesso também é restrito e o usuário tem que obter identificação e senha.


ADL: interface elaborada e o maior volume de dados geográficos

Outros exemplos notáveis de mapotecas digitais podem ser visitados nos sites da lista no final deste artigo.

Aplicações de Mapotecas Digitais
Mapotecas digitais são ótimas para centros de pesquisa com vários pesquisadores trabalhando com GIS. Na maioria dos casos, há layers necessários a mais de um pesquisador da mesma região, como hidrografia, modelos de terreno digital e imagens de satélite. A mapoteca permite concentrar o trabalho no desenvolvimento de layers específicos e relevantes a suas áreas de pesquisa. Tempo e custo da criação do banco de dados geográficos são reduzidos.

Firmas desenvolvedoras de mapas digitais, sistemas de GIS e que trabalham com imagens digitais também podem se beneficiar com uso de mapoteca digital. Os dados podem ser catalogados, armazenados, e visualizados online via rede local.

Outra aplicação que vem crescendo rapidamente é a venda de mapas digitais e imagens de satélite via Internet.
Reinaldo Escada Chohfi teve formação acadêmica na University of California, Los Angeles (UCLA). É engenheiro ambiental/ geógrafo, mestre em arqueologia e arquitetura, Ph.D. em urbanismo. Diretor Presidente da GeoDesign Internacional. Email:rchohfi@easygold.com.Br

Mapotecas Digitais dos EUA
1. Bay Area Digital GeoResource (BADGER): http://badger.parl.com
2. GRASSLinks: http://www.regis.berkeley.edu/grasslinks/index.html
3. Pennsylvania State University Library
Digital Chart of the World (DCW):
http://www.maproom.psu.edu/dcw
Pennsylvania Spatial Data (PASDA):
http://www.pasda.psu.edu
4. United States Bureau of Census (USBC) TIGER Map Service: http://tiger.census.gov/cgi-bin/mapbrowse-tbl
5. United States Geological Survey (USGS) San Francisco Bay Area Regional Database (BARD): http://bard.wr.usgs.gov/htmldir/clickablemap.html
6. University of California, Berkeley (UCB) Electronic Environmental Library: http://elib.cs.berkeley.edu
7. University of California, Los Angeles (UCLA) GIS Database Library: http://mu.oac.ucla.edu:60080
8. University of California, Santa Barbara (UCSB) Alexandria Digital Library: http://alexandria.sdc.ucsb.edu/web

Referências
1. Anderson, D. et. al. 1995 The WWW Prototype of the Alexandria Digital Library, UCSB, Santa Barbara, Califórnia, http://alexandria.sdc.ucsb.edu/public-documents/papers/japan-paper.
2. BADGER 1994 Public Use of Earth and Space Science Data Over the Internet: A Model for Public/Private Shared Access to Earth Science Data Over the Internet, Bay Area Digital GeoResource (BADGER), San Francisco, Califórnia, http://badger.parl.com/information/documents/proposal.html
3. Chohfi, R. E. e Slottow, J. 1997 UCLA Centrally-Distributed Geographic Information System (GIS) Database Using the Internet and a WWW Browser: Pilot Project Implementation Proposal, Office of Academic Computing (OAC), UCLA, Los Angeles, Califórnia, http://computing.oac.ucla.edu/Proposal/gisdb.htm.
4. Dozier, J. et. al. 1994 Towards a Distributed Digital Library with Comprehensive Services for Images and Spatially-Referenced Information, UCSB, Santa Barbara, Califórnia, http://alexandria.sdc.ucsb.edu/docs/proposal/index.html.
5. Frew, J., et. al. 1995 The Alexandria Rapid Prototype: Building a Digital Library for Spatial Information, ESRI User Conference Proceedings, May 22-25, Redlands, Califórnia. http://www.esri.com/library/userconf/proc95/to300/p255.html
6. Huse, S. 1995 GRASSLinks: A New Model for Spatial Information Access in Environmental Planning, UCB, Berkeley, Califórnia, http://www.regis.berkeley.edu:80/sue/phd.
7. Larson, R.R. 1995 Geographic Information Retrieval and Spatial Browsing, UCB, Berkeley, Califórnia, http://sherlock.sims.berkeley.edu/geo_ir/PART1.html.
8. Publicações da Mapoteca Digital da University of California, Berkeley (UCB), http://elib.cs.berkely.edu/papers.html.
9. Publicações da Mapoteca Digital da University of California, Santa Barbara (UCSB), http://alexandria.sdc.udsb.edu/docs/docs_frames.html.
10. Publicações da Iniciativa das Bibliotecas Digitais, http://dli.grainger.uiuc.edu/pubsnatsynch.html.
11. REGIS 1998 About GRASSLinks: The Public Access GIS, UCB, Berkeley, Califórnia, http://www.regis.berkeley.edu/glinks/about_gl.html.
12. Schatz, B. e H. Chen 1996 Building Large-Scale Digital Libraries, Computer, Maio, http://www.computer.org/computer/dli.
13. van House, N.A., M. Butler, e L. Schiff 1996 Needs Assessment and Evaluation of a Digital Environmental Library: The Berkeley Experience, UCB, Berkeley, Califórnia, http://info.sims.berkeley.edu/~vanhouse/dl96.html.