Na aula o professor falou que utilizando emissoes_por_ano.groupby('Gás').sum(numeric_only=True) retornaria todas as colunas numericas, entao a coluna de anos tb nao deveria ser somada?
Na aula o professor falou que utilizando emissoes_por_ano.groupby('Gás').sum(numeric_only=True) retornaria todas as colunas numericas, entao a coluna de anos tb nao deveria ser somada?
Bom dia Cindy! Tudo bem com você?
Embora os valores na coluna 'Ano'
pareçam numéricos, o Pandas os está tratando como strings (tipo object
). Quando isso acontece, as operações de soma podem não ser realizadas da maneira que esperamos, ou a coluna pode ser ignorada em operações que envolvem apenas valores numéricos, como você reparou bem:
A título de curiosidade, para corrigir isso, basta forçar a conversão da coluna 'Ano'
para o tipo numérico, usando o método astype(int)
:
emissoes_por_ano['Ano'] = emissoes_por_ano['Ano'].astype(int)
Esse código somaria tanto as emissões quanto os anos, mas normalmente a soma dos anos não tem um significado prático na maioria dos contextos analíticos. O ano é uma variável temporal, e somá-la pode gerar um valor que não faz sentido interpretativo, já que a soma de anos não reflete uma análise ou métrica relevante.
Em vez disso, a contagem ou a média dos anos pode ser mais adequada, dependendo do seu objetivo de análise. Em análises temporais, o ano geralmente é tratado como um identificador de período e não uma grandeza a ser somada.
Espero ter ajudado. Conte com o apoio do Fórum na sua jornada. Fico à disposição. Abraços e bons estudos!