Início » Aplicativos e Software » Excel apaga dados de 16 mil casos de coronavírus no Reino Unido

Excel apaga dados de 16 mil casos de coronavírus no Reino Unido

Agência de saúde pública usou formato antigo de planilha do Excel (XLS) para registrar casos de COVID-19 no do Reino Unido

Felipe Ventura Por

Funcionários da PHE (Public Health England), agência de saúde pública do Reino Unido, usaram um formato antigo de planilha do Excel para registrar casos de teste positivo do novo coronavírus. O arquivo pode ter no máximo 65 mil linhas; por isso, o programa da suíte Microsoft Office desconsiderou quase 16 mil casos de COVID-19 no país.

Microsoft Excel / desproteger planilha Excel

O que aconteceu no Reino Unido? O serviço NHS Test and Trace, que tenta conter a disseminação da COVID-19 no país, reuniu dados sobre testes do coronavírus em um arquivo CSV (texto com valores separados por vírgula), segundo o The Guardian.

Ele foi enviado para a PHE, que “configurou um processo automático para reunir esses dados no Excel”, diz a BBC. (Isso provavelmente é uma macro em VBA.) O problema: a conversão foi feita para o formato XLS, capaz de guardar até cerca de 65 mil linhas. Essa planilha só poderia armazenar aproximadamente 1.400 casos, porque cada resultado do teste de coronavírus cria várias linhas de dados.

E o que ocorre ao tentar converter para XLS um arquivo que estoure o limite de linhas? Bem, o Excel remove o restante, já que não vai caber na planilha. Por isso, 15.841 casos entre 25 de setembro e 2 de outubro ficaram de fora dos números diários informados pelo Reino Unido; felizmente, isso já foi corrigido.

COVID-19 no Reino Unido

Casos de COVID-19 no Reino Unido informados antes de descobrirem o erro da planilha (em laranja) e os casos não incluídos antes (azul); gráfico por Ars Technica

Qual é a diferença entre planilhas XLS e XLSX do Excel?

O Reino Unido está passando por um novo pico de infecções pelo coronavírus. O país realiza testes de COVID-19 e usa rastreamento de contato para informar quem precisa ficar de quarentena, a fim de reduzir o contágio. Todas as pessoas que testaram positivo foram informadas do diagnóstico; no entanto, se a planilha cortou seus dados, os contatos próximos não receberam o aviso.

Para evitar isso da próxima vez, a PHE precisa usar outro formato de planilha no Excel. O XLS permite armazenar até 65.536 linhas (ou 216) e 256 colunas (ou 28); enquanto o XLSX expande esse limite para 1.048.576 linhas (220) e 16.384 colunas (214).

Erros no uso do Excel já foram responsáveis por dores de cabeça no passado. Um estudo econômico sobre dívida e PIB foi questionado após descobrirem que os pesquisadores usaram fórmulas incorretas na planilha, deixando de incluir diversos países na comparação.

Com informações: Ars Technica.

Comentários da Comunidade

Participe da discussão
8 usuários participando

Os mais notáveis

Comentários com a maior pontuação

Andre Kittler (@Andre_Kittler)

Sim, o excel errou, Burro, seu programa burro! Não erra mais isso!
É como um cara codificar um video 4k em xvid (codec…) e reclamar do player depois…

@ksio89

E se tivessem convertido do formato ODS (LibreOffice/OpenOffice Calc) para o XLSX, iriam perder era tudo. Baixei uma planilha relativamente complexa gerada no Google Planilhas, e ao abrir no Calc, a formatação das imagens inseridas ficou bem zuada

Caleb Enyawbruce (@Enyawbruce)

XLS em pleno 2020?? Aí inocentou…

🤷‍♀️ (@xavier)

O Excel num apagou nada.

Limite do arquivo + incompetência humana + falha/falta de verificação de dados resultou na exclusão de quase 16 mil casos.

² (@centauro)

Depende muito do que tem na planilha mesmo. Eu imagino que algumas funções não tenham como converter direito, talvez mais ainda se você usar o App Script pra criar funções customizadas.

Sendo bem pendântico, foi o Excel que apagou sim. Isso porque o programa foi alimentado com mais do que 65000 linhas então ele simplesmente apagou o que excedeu esse limite.

Incompetência humana e falha/falta de verificação de dados foi o que permitiu que essa limitação de formato afetasse a integração dos dados.

Felipe Silva (@Felipe_Silva)

Falha geral ai, tanto humana quanto do excel que não avisou que estourou o limite de linhas numa importação de dados.

🤷‍♀️ (@xavier)

Então, segundo a matéria, foi utilizada uma macro em VBA. Não tenho conhecimento aprofundado, mas acredito que se não foi programada a verificação do estouro de linhas, não tinha mesmo como ter o aviso, não?

Caleb Enyawbruce (@Enyawbruce)

Exatamente. Nesse caso não vejo sentido em culpar a ferramenta. Ainda mais em um uso tão crítico, o mínimo que eles deveriam ter feito é se informar das limitações, que são facilmente encontradas em documentações no site da Microsoft. Joguei “Excel limite linhas” no Google e o primeiro resultado já era a documentação oficial:

imhotep (@imhotep)

Não se usa Excel pra esse tipo de análise, independente da quantidade de dados.

🤷‍♀️ (@xavier)

A ferramenta pouco importa, desde que quem use saiba o que esteja fazendo.

imhotep (@imhotep)

O que não é o caso, senão usaria um banco de dados de verdade.

🤷‍♀️ (@xavier)

Eu não sei se você não entendeu o que eu comentei ou só está querendo “causar”.
No benefício da dúvida, o que eu falei é que a ferramenta não foi o problema e sim quem manipulou. O Excel é apontado como o vilão, mas é a parte com “menos culpa” nessa história.

Poderiam ter usado “banco de dados de verdade”, se não tivessem conhecimento mínimo da plataforma, o resultado poderia ser o mesmo ou pior.

imhotep (@imhotep)

Eu não sou o tipo de usuário que quer lacrar como muitos aqui.

Se um órgão público não está preparado para analisar os seus dados, já está errado, não concorda?

Na Secretaria de Saúde que trabalhei, usavam codificação de dados em R, Py em bancos SQL.
Acho que é o mínimo que se espera de um órgão oficial.
Se não levaram a sério lá no Reino Unido, não sei o que pensar… Levar a sério diz respeito a ter gente competente pra executar.
Mas fica parecendo que não levaram a covid a sério.

🤷‍♀️ (@xavier)

Ok, então você entende meu ponto, o problema não é o software, o problema é com o recurso humano.

Felipe Silva (@Felipe_Silva)

Eu vejo da seguinte maneira, se é alguém que sabe o que tá fazendo e tem os recursos adequados, não vai escolher o excel, pois sabe que não é a ferramenta certa, se escolheu o excel, ou não sabe o que tá fazendo ou não tem recursos pra fazer o seu trabalho.

Já passou da hora de pararem de achar que excel é banco de dados e macro é software (o certo) de consulta e consolidação de dados.

Exibir mais comentários