1
resposta

[Reclamação] Aula muito confusa

Aula muito confusa, a aula repete muitas vezes a mesma variavel e colunas, parece que você monta o codigo e coloca ele novamente entre '[ ]' e ai faz uma outra filtragem não sei do que

1 resposta

Oii, Ramon! Como vai?

Sinto muito pela experiência, entendo que a aula pode parecer confusa, principalmente quando temos alguns processos a serem feitos para organizar o Dataframe. Mas não se preocupe, segue uma explicação sobre o conteúdo abaixo:

Na aula, o objetivo é ajustar o DataFrame emissoes_gases para deixar apenas os dados de "Emissão" que a equipe de supervisão pediu, excluindo categorias como "Remoção", "Remoção NCI" e "Bunker". Para isso, o código é construído passo a passo, e é por isso que você vê a coluna Emissão / Remoção / Bunker aparecendo várias vezes — cada passo refina os dados um pouco mais.

Então por que usamos [ ] várias vezes?

Os colchetes no Pandas são como uma ferramenta são usados para criar novas colunas, isolar colunas, e selecionar linhas no DataFrame. Por exemplo:

  • emissoes_gases['Emissão / Remoção / Bunker'] seleciona só essa coluna para olhar os valores dela (como quando usamos .unique() para ver as categorias: "Emissão", "Remoção", etc.).
  • Depois, usamos [ ] novamente para filtrar linhas, como em emissoes_gases[emissoes_gases['Emissão / Remoção / Bunker'] == 'Emissão'], que mantém só as linhas onde a categoria é "Emissão".

Essa "repetição" acontece porque primeiro exploramos os dados e depois aplicamos filtros para limpá-los.

Um exemplo baseado em aula
emissoes_gases[emissoes_gases['Emissão / Remoção / Bunker'].isin(['Remoção NCI', 'Remoção'])]

Aqui, estamos pegando só as linhas onde a coluna Emissão / Remoção / Bunker tem "Remoção NCI" ou "Remoção". O isin() é uma forma mais simples de filtrar vários valores de uma vez, evitando escrever condições separadas com o operador lógico == (significa igual a.)

O que estamos fazendo nessa aula?

A ideia é ir ajustando os dados aos poucos:

  • Primeiro, olhamos as categorias com .unique().
  • Depois, testamos filtros (como para "Remoção" ou "Bunker") para entender os dados.
  • Por fim, aplicamos o filtro final para manter só "Emissão" e remover o resto.

Isso pode parecer repetitivo, mas é um processo comum em Data Science para garantir que os dados estejam certos antes de continuar a análise.

Ramon, agradeço por compartilhar sua experiência, ela é muito válida e nos ajudará em futuras melhorias me nossos conteúdos. Caso surja outras dúvidas, conte conosco para te auxiliar.

Bons estudos e até mais!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado!