Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Dados de 'Recuperados' estão todos zerados

a database de pessoas recuperadas de covid, "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv", está rodando, mas todos os valores dos casos estão zerados, o que impossibilita análise de letalidade e afins.

Alguém mais está com esse problema?

1 resposta
solução!

Oii Érico, tudo bem contigo?

Realmente os dados mais recentes, a partir da data de 5 de agosto de 2021 em diante, estão com os números de recuperados zerados. Isso porque a base de dados não está sendo mais atualizada com os dados reais.

Dessa forma, de fato se torna inviável realizar o cálculo da letalidade para esses dados zerados. No entanto, é possível fazer esse cálculo para as datas anteriores ao dia 5 de agosto de 2021 que ainda possuem os números de recuperados.

Para realizar o fatiamento do dataframe a partir desta data, realize a operação a seguir:

confirmed = confirmed.loc[:, :'8/4/21']
deaths = deaths.loc[:, :'8/4/21']
recovered = recovered.loc[:, :'8/4/21']

Após isso, execute todas as células novamente. O resultado após a operação de letalidade será similar a tabela abaixo:

Country/Regionconfirmeddeathsrecoveredletality_rate_1letality_rate_2
Vanuatu4132525
MS Zaandam92722.222222.2222
Yemen70961380425119.447624.5072
Peru2.11907e+061966732.08609e+069.281118.61558
Mexico2.90109e+062425472.27043e+068.360549.65179
Sudan371382776306477.474828.30566
Syria260441919220197.36838.01654
Ecuador489089316944438806.480216.66437
Egypt284472165502321795.81786.65383
Somalia1565883276615.313589.7963

Abaixo, o código completo desta aula:

import pandas as pd

confirmed = pd.read_csv('https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv')
deaths = pd.read_csv("https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv")
recovered = pd.read_csv("https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv")


confirmed = confirmed.loc[:, :'8/4/21']
deaths = deaths.loc[:, :'8/4/21']
recovered = recovered.loc[:, :'8/4/21']


def latest_by_country(data):
  return data.groupby('Country/Region').sum().iloc[:,-1]


informations = [latest_by_country(confirmed), latest_by_country(deaths), latest_by_country(recovered)]
combined = pd.concat(informations, axis = 1)
combined.columns = ['confirmed', 'deaths', 'recovered']
combined.head()


letality_rate_1 = combined["deaths"] / combined["confirmed"] * 100
combined["letality_rate_1"] = letality_rate_1
combined.head()


letality_rate_2 = combined["deaths"] / (combined["deaths"] + combined["recovered"])


sum_up = combined.sum()
letality_rate_1 = sum_up["deaths"] / sum_up["confirmed"]
letality_rate_2 = sum_up["deaths"] / (sum_up["deaths"] + sum_up["recovered"])
print(letality_rate_1 * 100)
print(letality_rate_2 * 100)


letality_rate_1 = combined["deaths"] / combined["confirmed"] * 100
letality_rate_2 = combined["deaths"] / (combined["recovered"] + combined["deaths"]) * 100
combined["letality_rate_1"] = letality_rate_1
combined["letality_rate_2"] = letality_rate_2


combined.sort_values("letality_rate_1", ascending=False).head(10)

Espero ter ajudado. Qualquer dúvida fico à disposição :)

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!