1
resposta

[Reclamação] Resolução da situação-problema por parte do instrutor

Olá,

O exercicio que o instrutor resolveu em primeiro lugar pede para "Vamos identificar se as emissões de gases estufas aumentaram ou diminuíram ao longo dos anos".

Entendo que o que queremos é agrupar os dados por ano e assim conseguir formar acompanhamento historico anual. Logo depois deveriamos usar a função de agregação de soma, pois para comparar anos deveriamos comparar o total de emissões de cada ano. Porém, o instrutor usa mean(), o que não fez sentido em minha visão, pois ele irá com isso calcular em cada ano o valor médio de emissão pela quantidade de emissões informadas na planilha para cada ano. Tirando o fato de possivelmente ser utilizado soma acumulativa, a soma me parece o caminho inicial correto.

Eu estranhei e questionei a Luri, que me pareceu mais focada em ser diplomática do que ser tutora:

Informou que o instrutor estava correto e que isso se dava para proteger o gráfico de flutuações e descobrir uma tendência. Entendo que a resposta é insatisfatória: primeiramente não há porque se proteger de grande suavização de flutuações se esta ainda não havia sido verificada. Se este fosse o caso, entendo que o correto seria usar de métodos como média móvel e não média comum. Além disso, entendo que existe um risco latente quando a Luri diz que a média permite analisar a tendência "independentemente do número de medições" - sendo que em uma análise histórico isso não deveria ser uma variável totalmente descartável.

Em outro momento Luri comenta que "especialmente quando há variações significativas nos dados de emissão dentro de cada ano", talvez entrando no mérito de outliers. Pelo que sei, quando se quer tratar outliers se utiliza mediana e não média.

Enfim, a resolução do instrutor não me parece ainda a correta e queria verificar isto aqui. Se eu de fato estou analisando corretamente, a Luri não conseguiu também cumprir com seu papel.

Também achei as explicações do instrutor ao longo de todo o curso confusas, sem confiança, muitas vezes passando entre métodos e funções sem contexto ou planejamento. Acredito que a didática poderia ser bem melhor.

1 resposta

Olá, Felipe, tudo bem?

De fato, se o objetivo fosse responder de maneira estritamente estatística à pergunta “as emissões aumentaram ou diminuíram ao longo dos anos?”, a agregação por soma (sum) seria uma escolha mais direta, pois permitiria comparar o total de emissões ano a ano, independentemente da quantidade de registros em cada período.

Você também está certo ao observar que, se o objetivo fosse analisar tendência temporal com suavização de flutuações, uma média móvel seria metodologicamente mais adequada do que a média simples. Mas, ainda que a média móvel fosse uma alternativa válida para análise de tendência, didaticamente o instrutor opta por um recorte mais introdutório, visto que a média simples, embora não realize suavização temporal, permite observar o comportamento agregado dos dados em cada ano de forma direta.

Em uma análise mais aprofundada, inclusive, seria totalmente válido comparar sum e mean lado a lado, discutindo como mudanças na estrutura da base ao longo dos anos impactam cada métrica. Esse tipo de comparação ajuda bastante a entender as limitações e os significados de cada abordagem.

Agradeço muito por compartilhar esse olhar crítico no fórum. Questionamentos como o seu enriquecem a discussão e ajudam a aprofundar o entendimento sobre análise de dados para além da execução do código. Ele será considerado em materiais futuros.

Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!