quarta-feira, 10 de setembro de 2014

Armazenamento de dados de inflamação: Batendo TAPE fora o primeiro lugar arquivamento


Segurança para data centers virtualizados


Foi uma bomba quando o Facebook Jason Taylor disse que gostaria de usar o flash de armazenamento de estado sólido como um meio de arquivo, mas suas razões fazia todo o sentido.


Os usuários do Facebook tinha muitas fotos armazenadas em seus álbuns e raramente acessado eles. Mas quando queria olhar para eles que eles queriam vir para cima de imediato, se as fotos eram recentes ou cinco anos de idade.







Apenas uma forma particular de armazenamento flash poderia, em teoria, combinar os atributos Taylor pretendidos: baixo custo, a longo prazo, de armazenamento confiável e de acesso rápido.


Os dois tipos de mídia arquivo corrente, fita e disco, confiar em ser desligada quando não estiver sendo acessado e, portanto, consomem quase nenhuma energia. Assim como um meio de arquivo é acessado ele utiliza a energia e custo de energia elétrica é uma grande preocupação quando você está armazenando muitos petabytes de dados, indo em direção níveis exabyte, ao longo de muitos anos.


Um arquivo em fita é uma biblioteca com poucas unidades e centenas ou milhares de slots para cartuchos de fita offline. Mecanismos robô identificar onde um cartucho está localizado quando um arquivo é necessário e entregá-lo a uma unidade para ser montado e girou para o local correto na fita ferida para que o arquivo possa ser acessado.


Dose dupla


Tape é intrinsecamente o meio mais barato de arquivo. Ao contrário de discos rígidos, cartuchos de fita não tem nenhuma unidade incorporado caro ou motor. Eles armazenar dados com segurança por muitos anos ou mesmo décadas e são robustos. Eles também podem comprimir os dados e que pode dobrar ou triplicar a capacidade efetiva do cartucho.


A biblioteca de fitas funciona legal, uma vez que tem apenas algumas unidades que consomem energia e seus mecanismos de robô não usar muita força também. Isso significa que ele usa uma fração da energia e refrigeração necessária para uma quantidade equivalente de dados em uma matriz unidade de disco online.



Um arquivo em fita ainda tem um custo total de propriedade muito menor



A biblioteca ocupa um espaço de centro de dados, é claro, e isso é um custo, mas em comparação com um arquivo baseado em disco, um arquivo em fita ainda tem um custo total de propriedade mais baixo.


Como resultado, a idéia de usar o disco como um arquivo foi ridícula até recentemente. Dois avanços, no entanto, mudaram a matemática: a desduplicação e girando para baixo discos quando não estiver em uso.


Desduplicação: Muito melhor do que a compressão na remoção repetidas seqüências de bytes de dados, desduplicação permitiu fita para ser substituído por disco para backup e armazenamento de dados para as necessidades de proteção de curto prazo, tais como a recuperação de arquivos perdidos ou substituição de dados corrompidos.


A desduplicação pode atingir tanto quanto a 5: relação de dados com um backup de dados ou VDI (menos com imagens e dados estruturados). Isso, juntamente com o disco mais rápido acesso a dados *, era mais do que suficiente para causar a substituição por atacado de fita por disco para backup.


Girando-se os discos quando não estiver em uso: Girando o disco e acessar dados somente quando necessário é um processo muito mais rápido do que encontrar uma fita em uma biblioteca, roboticamente movê-lo para uma unidade, montá-lo e de streaming para o local certo.


Mesmo que a capacidade do disco acaba de chegar a 8 TB e 10 TB está em perspectiva com avanços como gravação magnética de telhas , e cada aumento de capacidade diminui o custo / GB de dados armazenados em disco, fita está aumentando sua densidade mais rápido, com cartuchos de 154TB demonstradas pela IBM.


A consultoria Wikibon declara tape "a densidade de área está crescendo em cerca de 30 por cento contra disco, que está crescendo a apenas 9,6 por cento."


Um disco que não está girando não precisa de energia e isso significa que o custo de desduplicação e girando para baixo do disco está se aproximando de custos de armazenamento em fita. Ele ainda não é tão como a fita para arquivamento de dados, ou como confiável eficiente em termos de custo, mas nos casos em que a velocidade de acesso dos dados do arquivo é uma alta prioridade, o disco começa a ser usado.


Seus usuários, no entanto, gostaria de uma maneira mais barata de arquivar seus dados sem perder a vantagem de velocidade do disco. E, eles diriam, disco girou para baixo não é rápido o suficiente para acesso a dados. Pode ser melhor do que a fita, mas isso é como comparar a pé para o rastreamento quando o que você realmente quer é um meio que pode correr.


Alguns casos de uso de arquivo se instalaram em Blu-ray discos ópticos como o meio de arquivo, mas nós entendemos isso é uma minoria e não um meio de arquivo mainstream. Aqui está um exemplo Facebook .



Nenhum comentário:

Postar um comentário