O GitHub criará uma imagem TAR de cada repositório público ativo e a manterá em um Arctic Vault

cofre de código ártico

O GitHub quer ter certeza de que parte do conhecimento global que é armazenado em discos rígidos, SSD (cuja vida útil teórica de 30 anos pressupõe calor e umidade estritamente controlados) é armazenado com segurança. E é que quer contribuir para a resolução desse problema e de outros como a ocorrência de desastres que provavelmente causam a perda de conteúdo.

Por isso lancei o projetoo "Arc Code Vault" em que a ideia por trás disso é salve o conteúdo dos repositórios em um meio de armazenamento que tenha uma vida útil mais longa. Piql, uma empresa norueguesa especializada em armazenamento de dados de muito longo prazo, é responsável por fornecer e codificar esses dados em filme. A tecnologia do filme é baseada em halogenetos de prata e poliéster.

Uma vez que os servidores e drives flash não são robustos o suficiente para este propósito, então os dados são codificados no que parecem bobinas de filmes antigos, cada um pesa alguns quilos e é armazenado em um recipiente de plástico branco do tamanho de uma caixa de pizza. É basicamente microfilme.

De acordo com medições ISO, esse material tem vida útil de 500 anos. Os testes de envelhecimento simulados indicam que o filme Piql vai durar o dobro do tempo.

Com isso, o GitHub planeja hospedar as fitas em uma mina de carvão. desmontado que está localizado no arquipélago de Svalbard, o arquivo está mais próximo do Pólo Norte do que do Círculo Polar Ártico.

A própria cidade é o lar de uma sala fria global. É uma das cidades mais setentrionais do planeta. Os arquivistas acreditam que o frio e as condições quase constantes contribuirão favoravelmente para a preservação do conteúdo.

Em 2 de fevereiro de 2020, o GitHub criará uma imagem TAR de cada repositório público ativo e irá mantê-lo no Arctic Code Vault. O arquivo incluirá itens da ramificação padrão de cada repositório, excluindo quaisquer arquivos binários maiores que 100 kilobytes. Para maior densidade e integridade de dados, a maioria dos dados será armazenada como um código QR. Um índice legível e um guia detalham a localização de cada repositório e explicam como recuperar os dados.

 

A plataforma então planeja multiplicar a duração do backup de conteúdo por 10. O GitHub firmou uma parceria com a Microsoft Research nessa direção por até 10,000 anos. Para conseguir isso, as equipes de pesquisa pretendem 'escreva o conteúdo em bandejas de vidro de quartzo usando lasers de femtosegundo. »

O Artic Code Vault é parte de um programa de arquivamento lançado pelo GitHub com vários parceiros, incluindo Internet Archive, Microsoft Research e Long Now Foundation. A estratégia se resume a «arquivar conteúdo em várias organizações de acordo com a recomendação do LOCKS - muitas cópias mantêm as coisas seguras".

A estratégia de backup é organizada em lotes que será atualizado em tempo real. Por exemplo, no nível do GitHub, os dados serão transferidos imediatamente para vários data centers em todo o mundo. Por outro lado Outros tipos de lotes serão tratados e serão atualizados mensalmente ou anualmente. Finalmente, o que será armazenado nesta proposta, na qual encontramos o Arc Code Vault, será atualizado a cada 5 anos no mínimo.

«A nossa principal missão é preservar o software livre para as gerações futuras. Também pretendemos que o GitHub Archive Program seja um testemunho da importância da comunidade de código aberto. Esperamos que, hoje e no futuro, ele aumente a conscientização sobre o movimento global de código aberto, uma vez que irá contribuir para uma maior adoção de políticas de código aberto e dados abertos em todo o mundo e incentivar o pensamento de longo prazo ", escreve o GitHub.

Se você quiser saber mais sobre o projeto Artic Code Vault, você pode consultar o seguinte link.


Deixe um comentário

Seu endereço de email não será publicado. Campos obrigatórios são marcados com *

*

*

  1. Responsável pelos dados: AB Internet Networks 2008 SL
  2. Finalidade dos dados: Controle de SPAM, gerenciamento de comentários.
  3. Legitimação: Seu consentimento
  4. Comunicação de dados: Os dados não serão comunicados a terceiros, exceto por obrigação legal.
  5. Armazenamento de dados: banco de dados hospedado pela Occentus Networks (UE)
  6. Direitos: A qualquer momento você pode limitar, recuperar e excluir suas informações.

  1.   anônimo dito

    Que cheiro ruim isso tem ... você pode me chamar de paranóico, mas a primeira coisa que pensei foi esta:
    Se eu quisesse mudar algo no nariz de todos, como faria?
    Eu faria um backup em outra mídia, finjo uma falha e excluo ou estrago o original, então recupero do backup o que quero e como quero ... dizendo a todos que esta é a cópia original.
    Talvez minha imaginação seja muito criativa, mas por um momento ... pense nisso.