3
respostas

[Sugestão] Poderiam regravar as aulas?

Fiquei perdido no curso depois da atualização dos dados do banco de dados online. Esse tem se atualizado desde a gravação da aula. Por exemplo, não existe mais a linha de "Mainland China", mas somente "China". Tentei adaptar, mas o capítulo de aulas "Fontes de dados e letalidade" começou a criar diferenças mais significativas, uma vez que o banco de dados da variável recovered tem seus valores praticamente zerados até a última data. Por exemplo:

recovered_transpose = recovered.transpose()[4:]#.columns = list(recovered["Country/Region"].values)
recovered_transpose.columns = list(recovered["Country/Region"].values)
recovered_transpose['Brazil'].plot()

Demonstra a falta de coleta de dados quase na metade das datas:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

3 respostas

Oi, Akhenaton! Como vai?

Esse curso tem um aspecto mais desafiador por tratar de dados que passaram por tantas modificações. Nessa atividade, estão algumas das modificações que aconteceram e que precisam de mais atenção.

O curso foi gravado no início de 2020, antes inclusive de termos impactos significativos da COVID-19 aqui no Brasil. Está, certamente, desatualizado, porém ainda tem se mostrado de grande valor como um desafio a mais, justamente pela surpresa em precisar se adaptar a interpretar os dados de forma diferente, além do assunto tratado ser algo que impactou a vida de toda e qualquer pessoa que possa estudá-lo.

Porém, aqui na Alura temos um formulário de sugestão de cursos. Você pode sugerir um novo curso de análise dos dados da pandemia, por exemplo. Será muito valioso para nós!

Espero que o desafio faça sentido para você! É necessário explorar outras possibilidades, compreendendo que a situação real mudou.

Abraços.

Enfim, decidi reassistir algumas das últimas aulas e adaptar os códigos. Compreendi que os vídeos estão atrasados, mas poderei me adaptar para ciência de dados na prática.

Procurei em qual data os dados de recovered terminavam:

#Procurando onde os dados de recovered terminam
recovered_transpose['Brazil'][['7/30/21','8/1/21','8/2/21','8/3/21','8/3/21','8/4/21','8/5/21','8/6/21']]
7/30/21    17771228
8/1/21     17771228
8/2/21     17771228
8/3/21     17771228
8/3/21     17771228
8/4/21     17771228
8/5/21            0
8/6/21            0
Name: Brazil, dtype: object

Defini a variável: last_date = '8/4/21'.

Tracei o gráfico para observação dos valores:

recovered_transpose = recovered.transpose().loc['1/22/20':last_date]
recovered_transpose.columns = list(recovered["Country/Region"].values)
recovered_transpose[['Brazil', 'Russia', 'India']].plot(figsize=(10,2))

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Em seguida, usei a variável last_date para diversas células do notebook, pois é onde os valores terminavam.

def latest_by_country(data):
  return data.groupby("Country/Region").sum().loc[:,last_date]

display(latest_by_country(confirmed).head())
display(latest_by_country(deaths).head())
display(latest_by_country(recovered).head())
informations = [latest_by_country(confirmed), latest_by_country(deaths), latest_by_country(recovered)]
combined = pd.concat(informations, axis=1)
combined.columns = ["confirmed", "deaths", "recovered"]
letality_rate_1 = combined["deaths"] / combined["confirmed"] * 100
letality_rate_2 = combined["deaths"] / (combined["recovered"] + combined["deaths"]) * 100
combined["letality_rate_1"] = letality_rate_1
combined["letality_rate_2"] = letality_rate_2
combined
Country/Regionconfirmeddeathsrecoveredletality_rate_1letality_rate_2
Afghanistan1489336836825864.589983415361277.644651204401601
Albania13331024571303141.84307253769409641.8505547145084393
Algeria17672444041184092.4920214571874793.585939599228095
Andorra14797128143800.86504021085355130.8822718500137855
Angola431581026395822.3773112748505492.5265957446808507
Antarctica000NaNNaN
Antigua and Barbuda13114312393.2799389778794813.3541341653666144
Outras linhas omitidas...

Boa, Akhenaton!

Mandou muito bem na sua adaptação do projeto ao formato atual dos dados. Esse exercício de investigação e exploração é super importante para consolidar o conhecimento técnico de uma forma que seja duradoura.

Espero que você tenha aproveitado o desafio. Abraços!