Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

[Dúvida] 08 Desafio: hora da prática - Exercício 4

#1) Faça um agrupamento de dados com base na coluna "Nível 1 - Setor" para visualizar o dicionário contendo as chaves de grupos formados e a lista de índices de cada grupo.
emissoes_por_ano.groupby('Nível 1 - Setor').groups #gera um dicionário
#2) Faça um agrupamento de dados com base na coluna "Nível 1 - Setor" e localize os dados do grupo "Agropecuária".
emissoes_por_ano.groupby('Nível 1 - Setor').get_group('Agropecuária')
#3) Faça um agrupamento de dados com base na coluna "Nível 1 - Setor" para identificar a média de emissão de cada atividade econômica no ano de 2021.
emissoes_por_ano[emissoes_por_ano['Ano']==2021].groupby('Nível 1 - Setor')[['Emissão']].mean()
#4) Faça um agrupamento de dados com base na coluna "Nível 1 - Setor" para identificar a soma de emissão de cada atividade econômica. Ordene os dados da maior para menor emissão.
emissoes_por_ano.groupby('Nível 1 - Setor')[['Emissão']].sum().sort_values(by='Emissão', ascending=False) 
#ou
emissoes_por_ano.groupby('Nível 1 - Setor')['Emissão'].sum().sort_values(ascending=False)

No exercício 4 consegui resouver destas duas formas. Há alguma diferença significativa em termos conceituais?

2 respostas
solução!

Olá, Wiliam! Como vai? :)

Primeiramente, parabéns por concluir a atividade! Em termos conceituais, ambas as abordagens que você utilizou para agrupar e ordenar os dados são muito semelhantes, mas há uma pequena diferença que vale a pena mencionar:

  1. Primeira abordagem:

    emissoes_por_ano.groupby('Nível 1 - Setor')[['Emissão']].sum().sort_values(by='Emissão', ascending=False)
    

    Aqui você está selecionando a coluna 'Emissão' como um DataFrame (note os dois colchetes), o que pode ser útil se você quiser manter a estrutura do DataFrame para realizar operações adicionais posteriormente.

  2. Segunda abordagem:

    emissoes_por_ano.groupby('Nível 1 - Setor')['Emissão'].sum().sort_values(ascending=False)
    

    Nesta abordagem, você está selecionando a coluna 'Emissão' como uma Series (note o uso de um colchete), o que pode ser mais direto e eficiente se você não precisar manter a estrutura do DataFrame para operações subsequentes.

→ A principal diferença está na forma como você seleciona a coluna 'Emissão' (como DataFrame ou Series).

Espero ter ajudado!

Abraço ✨✨

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Obrigado. Boa tarde!!