1
resposta

[Projeto] desafio: biblioteca pandas Pandas, associado a diferentes atributos e funções de agregação.

  1. Faça um agrupamento de dados com base na coluna "Nível 1 - Setor" para visualizar o dicionário contendo as chaves de grupos formados e a lista de índices de cada grupo.

resposta:

Agrupando por Setor e visualizando o dicionário de índices

agrupado_setor = emissoes_gases.groupby('Nível 1 - Setor')
print(agrupado_setor.groups)

  1. Faça um agrupamento de dados com base na coluna "Nível 1 - Setor" e localize os dados do grupo "Agropecuária".
    resposta:Localizar dados do grupo "Agropecuária",Para extrair um DataFrame contendo apenas as linhas de um grupo específico criado pelo groupby, utilizamos o método get_group().

Localizando apenas os registros de Agropecuária

grupo_agro = agrupado_setor.get_group('Agropecuária')
display(grupo_agro)

  1. Faça um agrupamento de dados com base na coluna "Nível 1 - Setor" para identificar a média de emissão de cada setor no ano de 2021.
    resposta: Média de emissão por setor em 2021. aqui aplicamos a função de agregação .mean() especificamente na coluna do ano de 2021.

Média de emissão de cada setor no ano de 2021

media_2021_setor = emissoes_gases.groupby('Nível 1 - Setor')[['2021']].mean()
display(media_2021_setor)

  1. Faça um agrupamento de dados com base na coluna "Nível 1 - Setor" para identificar a soma de emissão de cada setor. Ordene os dados da maior para menor emissão.

resposta:
Soma total por setor com ordenação (Maior para Menor), somamos todas as colunas numéricas (anos) e usamos o sort_values para organizar o resultado. Se você quiser a soma de todos os anos acumulados, pode somar as colunas antes ou focar em uma coluna de "Total" caso ela exista.

Soma de emissão por setor e ordenação decrescente

O .sum(numeric_only=True) garante que apenas colunas de anos sejam somadas

soma_setor = emissoes_gases.groupby('Nível 1 - Setor').sum(numeric_only=True)

Ordenando pela emissão de 2021 (ou qualquer coluna de interesse)

soma_ordenada = soma_setor.sort_values(by='2021', ascending=False)
display(soma_ordenada)

1 resposta

Ei! Tudo bem, Moacir?

Parabéns pela resolução dos desafios! Você demonstrou um ótimo domínio sobre o fluxo do groupby no Pandas, desde a visualização da estrutura de grupos até a aplicação de funções de agregação e ordenação.

Continue praticando com esses datasets de emissões, pois eles são excelentes para treinar manipulação de dados! Qualquer dúvida é só compartilhar no fórum.

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!