13 de setembro de 2011

Controle da Quantidade Excessiva de Dados

Para muitas empresas, gerenciar um grande volume de dados corporativos é um desafio interminável. Colocamos a seguir algumas estratégias concretas para assumir o controle nesta situação. 

O volume de informações digitais criadas e replicadas globalmente atingiu cerca de 800.000 petabytes em 2009 e crescerá cerca de 50%, até um número surpreendente de 1,2 milhões de petabytes (o que corresponde a 1,2 trilhões de gigabytes) em 2010, de acordo com a empresa global de análises IDC. Não só o armazenamento, indexação e arquivamento por conta do volume ficam cada vez mais difíceis, mas também, por conta do tipo de informações. Os dados corporativos consistem em materiais “não estruturados” ou baseados em arquivos como documentos, planilhas e imagens digitais, que é o tipo mais difícil de informação a ser localizada e armazenada. Para os gerentes de TI em empresas de médio e grande porte, qualquer organização pode controlar rigorosamente seus desafios de gerenciamento de dados, desde que saiba onde começar, como proceder e que tecnologia usar. 

Classificar e Consolidar

A etapa inicial, dizem os especialistas, é fazer um inventário e classificar os dados. Identificar diferentes tipos de informações armazenadas, qual o valor delas para a empresa, com que frequência são usadas e quanto tempo é possível ficar sem acessá-las. “Isso fornece as principais métricas para desenvolver uma arquitetura (de armazenamento de dados) subjacente”, diz Simon Johnson, diretor de serviços da GlassHouse Technologies Inc. A próxima etapa é desenvolver uma estratégia para consolidação de dados. Muitas empresas de médio porte usam um grande número de tecnologias isoladas de armazenamento que são difíceis de administrar, quando um armazenamento central é muito mais eficiente.

Três são as tecnologias que dominam o cenário de consolidação e armazenamento de dados atualmente: redes de área e armazenamento (SANs), armazenamento de conexão com a rede (NAS) e armazenamento de objetos. No passado, o SANs e a virtualização de armazenamento de dados eram as mais complexas e caras opções de consolidação, permanecendo fora de alcance para a maioria das empresas de médio porte, mas isso mudou graças ao surgimento de SANs baseadas na tecnologia de “interconexão” iSCSI. 

NAS e armazenamento de objetos são as tecnologias preferidas para a consolidação de dados não estruturados, onde o NAS tende a ser veloz, intuitivo e acessível. A escalabilidade, no entanto, pode ser um problema, pois a sobrecarga de dados poderá afetar o desempenho. Além disso, produtos NAS geralmente oferecem pouca ajuda em relação às dificuldades de indexação e à localização de informações baseadas em arquivos. 

Dispositivos de armazenamento de objetos ajudam em ambos os problemas, pois organizam as informações em unidades separadas, contendo dados (um arquivo) e metadados (informações sobre o arquivo, como quem o criou e seu assunto). Os administradores podem coletar quantos metadados desejarem e personalizar quais categorias controlam. Dessa forma, é possível configurar o ambiente de armazenamento de dados para impor automaticamente políticas de gerenciamento. 

Backup

O armazenamento é apenas uma parte da equação de gerenciamento de dados e proteger as informações contra perdas devido a erros humanos ou falhas de hardware é essencial. Felizmente soluções de backup eficientes nunca estiveram tão amplamente disponíveis. As empresas podem implantar diversos aplicativos automatizados a fim de copiar dados para uma grande variedade de sistemas de armazenamento, baseados em fitas e de disco para disco (D2D). Sistemas baseados em fitas geralmente são mais baratos do que discos, porém, mais lentos. Soluções D2D são rápidas e confiáveis, mas menos portáteis do que fitas, tornando-se assim mais fáceis de usar como repositório de backup fora do local. 

Tecnologias de exclusão de dados duplicados podem simplificar ainda mais o processo de backup. A maioria dos ambientes de armazenamento contém várias instâncias de dados e os sistemas de exclusão eliminam possíveis duplicidades, gerando assim uma economia significativa na capacidade de armazenamento. Grande parte destas tecnologias estão pautadas em duas categorias: origem (excluem duplicações antecipadamente) e destino (excluem duplicações após terem sido copiadas em toda a rede). 

Por outro lado, ainda é possível abrir mão de soluções de armazenamento no local e adotar os serviços de backup em nuvens, mas neste caso, é preciso certificar-se de que o fornecedor use as mais recentes técnicas de criptografia e esteja certificado sob padrões de segurança, como SAS 70 e ISO 9000. 

Fonte: Revista Catalyst – Jan./2011