1
resposta

Duvida sobre o atributo numeric_only

Na aula o professor falou que utilizando emissoes_por_ano.groupby('Gás').sum(numeric_only=True) retornaria todas as colunas numericas, entao a coluna de anos tb nao deveria ser somada?

1 resposta

Bom dia Cindy! Tudo bem com você?

Embora os valores na coluna 'Ano' pareçam numéricos, o Pandas os está tratando como strings (tipo object). Quando isso acontece, as operações de soma podem não ser realizadas da maneira que esperamos, ou a coluna pode ser ignorada em operações que envolvem apenas valores numéricos, como você reparou bem:

A saída do comando emissoes_por_ano.dtypes está exibindo os tipos de dados de cada coluna em um DataFrame do pandas e a coluna ano é do tipo object e está com destaque

A título de curiosidade, para corrigir isso, basta forçar a conversão da coluna 'Ano' para o tipo numérico, usando o método astype(int):

emissoes_por_ano['Ano'] = emissoes_por_ano['Ano'].astype(int)
Ícone de sugestão Para saber mais:

Esse código somaria tanto as emissões quanto os anos, mas normalmente a soma dos anos não tem um significado prático na maioria dos contextos analíticos. O ano é uma variável temporal, e somá-la pode gerar um valor que não faz sentido interpretativo, já que a soma de anos não reflete uma análise ou métrica relevante.

Em vez disso, a contagem ou a média dos anos pode ser mais adequada, dependendo do seu objetivo de análise. Em análises temporais, o ano geralmente é tratado como um identificador de período e não uma grandeza a ser somada.

Espero ter ajudado. Conte com o apoio do Fórum na sua jornada. Fico à disposição. Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado