Início » Ciência » GitHub envia 21 TB ao Ártico para preservar códigos por 1.000 anos

GitHub envia 21 TB ao Ártico para preservar códigos por 1.000 anos

Filmes fotossensíveis com backup de repositórios do GitHub foram depositados no Ártico e devem aguentar um milênio

Paulo Higa Por

As empresas costumam fazer cópias de segurança periódicas para garantir que seus dados não sejam perdidos, mas o GitHub foi (muito) além: o GitHub Archive Program é um plano para preservar os repositórios de softwares por um milênio. E a companhia acaba de depositar filmes com 21 terabytes de códigos-fontes em um arquipélago no Ártico. Sim, filmes. No Ártico.

GitHub Archive Program

O GitHub Archive Program tem como missão “preservar softwares de código aberto para as futuras gerações”. Em parceria com o Internet Archive, a Microsoft Research e outras instituições, o serviço quer guardar os códigos “armazenando múltiplas cópias, continuamente, em vários locais e formatos de dados, incluindo um arquivo de longo prazo projetado para durar pelo menos 1.000 anos”.

Mesmo discos rígidos, SSDs ou mídias ópticas duram apenas algumas décadas. Uma fita de backup armazenada em condições ideais de temperatura e umidade tem vida útil estimada em 30 anos. Por isso, a solução foi guardar todos os repositórios em piqlFilm, um filme digital fotossensível para arquivamento de dados de longa duração. Cada bobina de filme tem 1 km de comprimento.

Filme Piql

Em meio a uma pandemia global, a logística precisou ser adaptada. Primeiro, o GitHub criou uma cópia de todos os repositórios públicos em 2 de fevereiro de 2020. Depois, a empresa de arquivamento Piql, cuja sede fica na Noruega, gravou os códigos em 186 bobinas de filmes, um processo que levou meses para ser concluído.

Então, diversas caixas com os filmes de arquivamento voaram até a capital norueguesa Oslo antes de seguir viagem para o arquipélago Svalbard, que está sob soberania da Noruega, mas pode ser acessado livremente pelos 46 países que assinaram o Tratado de Svalbard (o Brasil não é um deles). Svalbard tem 2,9 mil habitantes que sobrevivem a temperaturas médias de 5 ºC no verão e -14 ºC no inverno.

GitHub Archive Program

Depois de desembarcar em Svalbard, os filmes do GitHub viajaram para uma mina de carvão desativada e finalmente, em 8 de julho de 2020, foram depositados em uma câmara com centenas de metros de profundidade coberta com permafrost (reza a lenda que o nome em português é “pergelissolo”), um tipo de solo comum no Ártico, composto por terra, gelo e rochas, que pode permanecer congelado por anos.

“Futuros historiadores poderão aprender sobre nós a partir de projetos e metadados de código aberto”, diz o GitHub. “Eles podem considerar nossa era da onipresença do código aberto, das comunidades de voluntários e da Lei de Moore como historicamente significativas”.

Comentários da Comunidade

Participe da discussão
8 usuários participando

Os mais notáveis

Comentários com a maior pontuação

🤷‍♀️ (@xavier)

“Futuros historiadores poderão aprender sobre nós a partir de projetos e metadados de código aberto”

Mas, qual foi o conteúdo guardado? E será que guardaram também um modo de “ler” esses dados? Ou os dados são realmente frames, igual a película de cinema? Estou realmente muito confuso. hahahaha

Eric Viana (@Eric_Viana)

Vale lembrar que Svalbard é o mesmo local do Cofre Mundial de Sementes. Uma instalação que mantem sementes nativas de culturas de vários lugares do mundo para preservação e utilização em caso de catástrofes.

Eu (@Keaton)

Qual o sentido de guardar código defasado por 1000 anos? (não está defasado agora, mas daqui a menos de cinco anos já estará)

Douglas Knevitz (@Douglas_Knevitz)

Não é para nós, mas para futuras gerações.

Pense nisso como as pinturas rupestres, só que dessa vez somos nós a deixar nossa marca, só que impressa em filmes analógicos.

Eu (@Keaton)

O que as futuras gerações farão com código que provavelmente nem funcionará mais no hardware deles? hahaha

É provável que nem as linguagens de programação existam mais. Sei lá, acho mais uma jogada de marketing que uma coisa viável.

Léo (@leo_oliveira)

Com certeza a humanidade estará aqui em mil anos

Mateus B. Cassiano (@mbc07)

Segundo o website da iniciativa:

O instantâneo incluirá todos os repositórios públicos com commits realizadas entre o anúncio no GitHub Universe (13/11/2019) e a data de arquivamento (02/02/2020), todos os repositórios públicos com pelo menos 1 estrela e pelo menos um commit no ano anterior ao arquivamento (03/02/2019 a 02/02/2020) e todos os repositórios públicos com pelo menos 250 estrelas.
[…]
Um índice e um guia legíveis por humanos detalham a localização de cada repositório e explicam como recuperar os dados.

Gabriel Lopes (@glopesmartins)

Eu estou vendo as pessoas confusas e tal. Se você sabe inglês recomendo assistir a um episódio do Hello World, da Bloomberg, aonde falam exatamente sobre isso. Eles explicam um pouco e ainda tem a participação do próprio CEO do GitHub.

É um episódio bem legal, eles mostram o local e falam sobre coisas relacionadas também. Para aqueles que não verão o vídeo por não saberem inglês ou desinteresse, vou tentar resumir (meio que repetindo o que o Higa falou):

“Mil anos” acho um pouco jogada de marketing, mas a intenção é ser um backup físico para no caso de um evento apocalíptico os códigos de software aberto estarem seguros. Já que, segundo o Nat Friedman, CEO do GitHub, o mundo inteiro está começando a funcionar via software e grande parte dele seria de fonte-aberta.


Eric Viana (@Eric_Viana)

Leve menos como funcionalidade e mais como registro histórico.
Não encontramos real funcionalidade nos hieróglifos, pinturas rupestres, calendários antigos que sirvam para nós em nosso tempo… Só que esses materiais formam o registro daqueles humanos na História. Em 1000 anos o que sobra de nós enquanto sociedade baseada em código digital? Nada se não houver alguma preservação.