Algumas Análises e Explorações COVID-19

Mario O. de Menezes

Brazil

Introdução

A pandemia do novo coronavirus tomou o mundo de assalto. Notícias em todo o lugar dão conta do rápido alastramento do vírus em todo o mundo, e os seus números são alarmantes.

Para permitir que mais e mais pessoas possam ajudar no combate ao vírus, das mais diversas formas, organizações ao redor do mundo tem disponibilizado dados sobre a evolução da COVID-19 em todo o globo.

Dentre as organizações que disponibilizam dados estão a European Union Open Data Portal, a John Hopkins University através de um repositório no GitHub.

Com abundância de dados, me propus a realizar algumas explorações e tabulações destes dados visando entender melhor o cenário mundial.

Disclaimer

Este é um trabalho em andamento; não tem cunho científico e nem pretende que sirva de embasamento para qualquer tomada de decisão. É uma abordagem estritamente pessoal.

HOME HOME


Bases de Dados

Existem várias bases de dados disponíveis sobre a evolução da COVID-19 no mundo. Dentre estas, estou utilizando três para algumas análises e explorações:

  • EU Open Data Portal
  • CSSE at Johns Hopkins University
  • Kaggle – Coronavirus - Brazil, Coronavirus (COVID-19) - Brazil Dataset (by Raphael Fontes) - tks Raphael :-)

Uma base interessante pela atualização é o Worldometer, mas infelizmente ele só oferece instantâneos, não tem série histórica.

O download e preparação das bases é feito em um notebook separado para não poluir muito aqui. O link é: Preparação dos Dados

Base de dados do EU Open Data Portal

Total de Casos pelos dados da EU Open Data Portal: 14-12-2020

Casos Mortes Letalidade
71503614 1612833 2.26%

Brasil vs Itália

Uma mostra dos últimos 20 dias da Itália.

O mesmo para o Brasil, últimos 20 dias.

Como a base de dados contém alguns países estranhos, como o navio de cruzeiro ancorado no Japão, alguns territórios em disputa, como Kosovo, vou eliminar todas as observações que não tem o Continente especificado. São 1017 observações, que totalizam 4.8032^{4} casos.

Alguns gráficos exploratórios com a base EU Open Data Portal

Países com mais de 500 casos confirmados: 14-12-2020

Base de dados da John Hopkins University

Total de Casos pelos dados da John Hopkins University (JHU): 19-09-2022

Casos Confirmados Mortos Recuperados
612408336 6527907 697

Últimos 10 dias para alguns países: 19-09-2022

Para poder estudar o crescimento do número de casos e de mortes, foi adicionada uma coluna com o número de casos de um dia para o outro, já que a base de dados reporta o total de casos em cada dia e não quantos casos foram registrados naquele dia.

Lista de países com mais de 500 casos, ordenados por número de casos confirmados: 19-09-2022

Alguns gráficos exploratórios com a base do JHU

Calculando a taxa de progressão dia-a-dia: Brasil, Itália, China, USA, França, Alemanha, Espanha

Seguindo a ideia apresentada neste vídeo Te Explico POR QUÉ estoy PREOCUPADO, calculei a taxa de evolução (chamado de ‘factor’ no vídeo) A taxa de evolução representada aqui é dada por \[TxEv = \frac{NumCasos_i - NumCasos_{i-1}}{NumCasos_{i-1}} + 1\] É uma maneira simples de representar o acréscimo proporcional de um dia para outro.

Gráficos individuais por países: Taxa de evolução e número de novos casos

Casos confirmados vs Novos Casos

O gráfico abaixo é interessante para ver que os comportamentos são muito parecidos. Usei uma média móvel de 7 observações.

Agora apenas com os países com comportamentos mais parecidos: Itália, Espanha, Alemanha

Casos Confirmados vs Número de dias decorridos após 100º caso

Para colocar todos os países no mesmo gráfico, é necessário utilizar uma escala log, que comprime a amplitude dos dados, permitindo melhor visualização do comportamento geral.

Países com números de casos semelhantes ao Brasil em 25/03/2020

Em 25 de Março de 2020, os países abaixo tinham número de casos próximos entre si; estabeleci uma faixa, variando de 2304 a 2804 e filtrei os países. Adicionei à lista, que estava fora desta faixa, Portugal.

Country ConfirmedCases
Australia 2364
Brazil 2554
Israel 2369
Sweden 2526
Turkey 2433
Portugal 2995

Os gráficos a seguir mostram a evolução dos casos nestes países a partir de pontos diferentes:

  • a partir do 1º caso, 55 dias
  • a partir do 14º caso, 35 dias
  • a partir do 30º caso, até último dado.

Calculando a taxa de progressão dia-a-dia: Brazil, Portugal, Sweden, Turkey, Israel, Australia


Gráficos individuais dos países semelhantes ao Brasil: Taxa de evolução e número de novos casos

Base de dados do Worldometer

Esta base de dados tem uma atualização bem interessante, com algumas variáveis também interessantes.

Ela está disponível em https://www.worldometers.info/coronavirus/

O problema é que não achei nenhum csv ou xlsx para baixar; então vou a solução é fazer um web scraping e pegar os dados. Utilizando o pacote rvest e seguindo a dica deste post foi razoavelmente fácil.

Após diversas mudanças na página do Worldometer, estou desistindo de manter estes web scraping

Olhando a estrutura destes dados:

Depois de pegar a tabela em html e colocar em um data.frame, algumas limpezas e transformações são necessárias: algumas colunas, como a NewCases, tem o símbolo +; os números vieram formatados como strings com separador de milhar (,), e algumas outras coisas. Então, algumas manipulações serão feitas para acertar isso.

Total de Casos pelos dados do Worldometer: 20-09-2022

O Worldometer não contabiliza os casos do Diamond Princess ou contabiliza juntamente com algum país, ou países (da nacionalidade de cada pessoa). Então, estou retirando também para refletir o valor mostrado no site do Worldometer.

O Worldometer também passou a apresentar totais de alguns continentes ou regiões; como não está padronizado, ou seja, não estão agrupando por continentes, que seria fácil remover na filtragem; ao invés disso, colocaram por exemplo, North America e South America, mas não tem Americas. Depois do dia 09 ou 10 de abril, o Worldometer passou a incluir uma linha World na tabela. Assim, estou removendo de acordo com o que eles mudam no site.

Lista de países com mais de 500 casos, ordenados por número de casos confirmados: 20-09-2022

Conforme explicado acima, o Worldometer passou a incluir totalizações por continentes e regiões. Vou manter na listagem para facilitar a comparação dos valores.

Dados do Kaggle - Coronavirus - Brazil

Total de Casos pelos dados do Kaggle Brazil: 23-05-2021

Casos Confirmados Total Mortes Letalidade
16083258 449068 2.8%

Incorporando a estimativa da população brasileira com os dados do IBGE, publicados em Janeiro de 2020, conforme esta página: IBGE - Estimativas População, enviada ao TCU

Dados do Brasil a partir do Projeto Brasil.io

Descobri em 15/04/2020 este projeto fantástico: Brasil.io

O Brasil em dados libertos

Repositório de dados públicos disponibilizados em formato acessível

Dentre as diversas bases de dados que eles disponibilizam, tem uma sobre a COVID-19 em território brasileiro.

Esta é uma primeira utilização, simples, para entender a base. Como esta base contém informações dos municípios brasileiros, penso que será possível explorá-la bastante.

Total de Casos pelos dados do Brasil.io: 27-03-2022

Casos Confirmados Total Mortes Letalidade
29849740 659159 2.2%


HOME HOME Página gerada em: “Tue 20 Sep 2022 03:04:18 AM -03”