1
resposta

Número de recuperados zerado

Olá! Eu não sei se foi erro meu de algum tipo, mas creio que os dados de recuperados estão todos zerados no dataset baixado nos dias de hoje. Não sei se não é mais utilizado esse dado da pessoas ter sido recuperada ou algum outro problema, mas ai se torna inviável de se fazer a conta de letalidade 2.

Alguém poderia ver se é isso mesmo ou se estou fazendo algo de errado?

1 resposta

Oii Victor, tudo bem contigo?

Peço desculpas pela demora em dar um retorno.

Realmente os dados mais recentes, a partir da data de 5 de agosto de 2021 em diante, estão com os números de recuperados zerados. Isso porque a base de dados não está sendo mais atualizada com os dados reais.

Dessa forma, de fato se torna inviável realizar o cálculo da letalidade para esses dados zerados. No entanto, é possível fazer esse cálculo para as datas anteriores ao dia 5 de agosto de 2021 que ainda possuem os números de recuperados.

Para realizar o fatiamento do dataframe a partir desta data, realize a operação a seguir:

confirmed = confirmed.loc[:, :'8/4/21']
deaths = deaths.loc[:, :'8/4/21']
recovered = recovered.loc[:, :'8/4/21']

Após isso, execute todas as células novamente. O resultado após a operação de letalidade será similar a tabela abaixo:

Country/Regionconfirmeddeathsrecoveredletality_rate_1letality_rate_2
Vanuatu4132525
MS Zaandam92722.222222.2222
Yemen70961380425119.447624.5072
Peru2.11907e+061966732.08609e+069.281118.61558
Mexico2.90109e+062425472.27043e+068.360549.65179
Sudan371382776306477.474828.30566
Syria260441919220197.36838.01654
Ecuador489089316944438806.480216.66437
Egypt284472165502321795.81786.65383
Somalia1565883276615.313589.7963

Abaixo, o código completo desta aula:

import pandas as pd

confirmed = pd.read_csv('https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv')
deaths = pd.read_csv("https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv")
recovered = pd.read_csv("https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv")


confirmed = confirmed.loc[:, :'8/4/21']
deaths = deaths.loc[:, :'8/4/21']
recovered = recovered.loc[:, :'8/4/21']


def latest_by_country(data):
  return data.groupby('Country/Region').sum().iloc[:,-1]


informations = [latest_by_country(confirmed), latest_by_country(deaths), latest_by_country(recovered)]
combined = pd.concat(informations, axis = 1)
combined.columns = ['confirmed', 'deaths', 'recovered']
combined.head()


letality_rate_1 = combined["deaths"] / combined["confirmed"] * 100
combined["letality_rate_1"] = letality_rate_1
combined.head()


letality_rate_2 = combined["deaths"] / (combined["deaths"] + combined["recovered"])


sum_up = combined.sum()
letality_rate_1 = sum_up["deaths"] / sum_up["confirmed"]
letality_rate_2 = sum_up["deaths"] / (sum_up["deaths"] + sum_up["recovered"])
print(letality_rate_1 * 100)
print(letality_rate_2 * 100)


letality_rate_1 = combined["deaths"] / combined["confirmed"] * 100
letality_rate_2 = combined["deaths"] / (combined["recovered"] + combined["deaths"]) * 100
combined["letality_rate_1"] = letality_rate_1
combined["letality_rate_2"] = letality_rate_2


combined.sort_values("letality_rate_1", ascending=False).head(10)

Espero ter ajudado. Qualquer dúvida fico à disposição :)

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!