Introdução
A pandemia do novo coronavirus tomou o mundo de assalto. Notícias em todo o lugar dão conta do rápido alastramento do vírus em todo o mundo, e os seus números são alarmantes.
Para permitir que mais e mais pessoas possam ajudar no combate ao vírus, das mais diversas formas, organizações ao redor do mundo tem disponibilizado dados sobre a evolução da COVID-19 em todo o globo.
Dentre as organizações que disponibilizam dados estão a European Union Open Data Portal, a John Hopkins University através de um repositório no GitHub.
Com abundância de dados, me propus a realizar algumas explorações e tabulações destes dados visando entender melhor o cenário mundial.
Disclaimer
Este é um trabalho em andamento; não tem cunho científico e nem pretende que sirva de embasamento para qualquer tomada de decisão. É uma abordagem estritamente pessoal.
Bases de Dados
Existem várias bases de dados disponíveis sobre a evolução da COVID-19 no mundo. Dentre estas, estou utilizando três para algumas análises e explorações:
- EU Open Data Portal
- CSSE at Johns Hopkins University
- Kaggle – Coronavirus - Brazil, Coronavirus (COVID-19) - Brazil Dataset (by Raphael Fontes) - tks Raphael :-)
Uma base interessante pela atualização é o Worldometer, mas infelizmente ele só oferece instantâneos, não tem série histórica.
O download e preparação das bases é feito em um notebook separado para não poluir muito aqui. O link é: Preparação dos Dados
Base de dados do EU Open Data Portal
Total de Casos pelos dados da EU Open Data Portal: 14-12-2020
Casos | Mortes | Letalidade |
---|---|---|
71503614 | 1612833 | 2.26% |
Brasil vs Itália
Uma mostra dos últimos 20 dias da Itália.
O mesmo para o Brasil, últimos 20 dias.
Como a base de dados contém alguns países estranhos, como o navio de cruzeiro ancorado no Japão, alguns territórios em disputa, como Kosovo, vou eliminar todas as observações que não tem o Continente especificado. São 1017 observações, que totalizam 4.8032^{4} casos.
Alguns gráficos exploratórios com a base EU Open Data Portal
Países com mais de 500 casos confirmados: 14-12-2020
Base de dados da John Hopkins University
Total de Casos pelos dados da John Hopkins University (JHU): 19-09-2022
Casos Confirmados | Mortos | Recuperados |
---|---|---|
612408336 | 6527907 | 697 |
Últimos 10 dias para alguns países: 19-09-2022
Para poder estudar o crescimento do número de casos e de mortes, foi adicionada uma coluna com o número de casos de um dia para o outro, já que a base de dados reporta o total de casos em cada dia e não quantos casos foram registrados naquele dia.
Lista de países com mais de 500 casos, ordenados por número de casos confirmados: 19-09-2022
Alguns gráficos exploratórios com a base do JHU
Calculando a taxa de progressão dia-a-dia: Brasil, Itália, China, USA, França, Alemanha, Espanha
Seguindo a ideia apresentada neste vídeo Te Explico POR QUÉ estoy PREOCUPADO, calculei a taxa de evolução (chamado de ‘factor’ no vídeo) A taxa de evolução representada aqui é dada por \[TxEv = \frac{NumCasos_i - NumCasos_{i-1}}{NumCasos_{i-1}} + 1\] É uma maneira simples de representar o acréscimo proporcional de um dia para outro.
Gráficos individuais por países: Taxa de evolução e número de novos casos
Casos confirmados vs Novos Casos
O gráfico abaixo é interessante para ver que os comportamentos são muito parecidos. Usei uma média móvel de 7 observações.
Agora apenas com os países com comportamentos mais parecidos: Itália, Espanha, Alemanha
Casos Confirmados vs Número de dias decorridos após 100º caso
Para colocar todos os países no mesmo gráfico, é necessário utilizar uma escala log, que comprime a amplitude dos dados, permitindo melhor visualização do comportamento geral.
Países com números de casos semelhantes ao Brasil em 25/03/2020
Em 25 de Março de 2020, os países abaixo tinham número de casos próximos entre si; estabeleci uma faixa, variando de 2304 a 2804 e filtrei os países. Adicionei à lista, que estava fora desta faixa, Portugal.
Country | ConfirmedCases |
---|---|
Australia | 2364 |
Brazil | 2554 |
Israel | 2369 |
Sweden | 2526 |
Turkey | 2433 |
Portugal | 2995 |
Os gráficos a seguir mostram a evolução dos casos nestes países a partir de pontos diferentes:
- a partir do 1º caso, 55 dias
- a partir do 14º caso, 35 dias
- a partir do 30º caso, até último dado.
Calculando a taxa de progressão dia-a-dia: Brazil, Portugal, Sweden, Turkey, Israel, Australia
Gráficos individuais dos países semelhantes ao Brasil: Taxa de evolução e número de novos casos
Base de dados do Worldometer
Esta base de dados tem uma atualização bem interessante, com algumas variáveis também interessantes.
Ela está disponível em https://www.worldometers.info/coronavirus/
O problema é que não achei nenhum csv
ou xlsx
para baixar; então vou a solução é fazer um web scraping e pegar os dados. Utilizando o pacote rvest
e seguindo a dica deste post foi razoavelmente fácil.
Após diversas mudanças na página do Worldometer, estou desistindo de manter estes web scraping
Olhando a estrutura destes dados:
Depois de pegar a tabela em html e colocar em um data.frame
, algumas limpezas e transformações são necessárias: algumas colunas, como a NewCases
, tem o símbolo +
; os números vieram formatados como strings com separador de milhar (,
), e algumas outras coisas. Então, algumas manipulações serão feitas para acertar isso.
Total de Casos pelos dados do Worldometer: 20-09-2022
O Worldometer não contabiliza os casos do Diamond Princess ou contabiliza juntamente com algum país, ou países (da nacionalidade de cada pessoa). Então, estou retirando também para refletir o valor mostrado no site do Worldometer.
O Worldometer também passou a apresentar totais de alguns continentes ou regiões; como não está padronizado, ou seja, não estão agrupando por continentes, que seria fácil remover na filtragem; ao invés disso, colocaram por exemplo, North America e South America, mas não tem Americas. Depois do dia 09 ou 10 de abril, o Worldometer passou a incluir uma linha World na tabela. Assim, estou removendo de acordo com o que eles mudam no site.
Lista de países com mais de 500 casos, ordenados por número de casos confirmados: 20-09-2022
Conforme explicado acima, o Worldometer passou a incluir totalizações por continentes e regiões. Vou manter na listagem para facilitar a comparação dos valores.
Dados do Kaggle - Coronavirus - Brazil
Total de Casos pelos dados do Kaggle Brazil: 23-05-2021
Casos Confirmados | Total Mortes | Letalidade |
---|---|---|
16083258 | 449068 | 2.8% |
Incorporando a estimativa da população brasileira com os dados do IBGE, publicados em Janeiro de 2020, conforme esta página: IBGE - Estimativas População, enviada ao TCU
Dados do Brasil a partir do Projeto Brasil.io
Descobri em 15/04/2020 este projeto fantástico: Brasil.io
O Brasil em dados libertos
Repositório de dados públicos disponibilizados em formato acessível
Dentre as diversas bases de dados que eles disponibilizam, tem uma sobre a COVID-19 em território brasileiro.
Esta é uma primeira utilização, simples, para entender a base. Como esta base contém informações dos municípios brasileiros, penso que será possível explorá-la bastante.
Total de Casos pelos dados do Brasil.io: 27-03-2022
Casos Confirmados | Total Mortes | Letalidade |
---|---|---|
29849740 | 659159 | 2.2% |