Aula muito confusa, a aula repete muitas vezes a mesma variavel e colunas, parece que você monta o codigo e coloca ele novamente entre '[ ]' e ai faz uma outra filtragem não sei do que
Aula muito confusa, a aula repete muitas vezes a mesma variavel e colunas, parece que você monta o codigo e coloca ele novamente entre '[ ]' e ai faz uma outra filtragem não sei do que
Oii, Ramon! Como vai?
Sinto muito pela experiência, entendo que a aula pode parecer confusa, principalmente quando temos alguns processos a serem feitos para organizar o Dataframe. Mas não se preocupe, segue uma explicação sobre o conteúdo abaixo:
Na aula, o objetivo é ajustar o DataFrame emissoes_gases
para deixar apenas os dados de "Emissão"
que a equipe de supervisão pediu, excluindo categorias como "Remoção
", "Remoção NCI
" e "Bunker
". Para isso, o código é construído passo a passo, e é por isso que você vê a coluna Emissão / Remoção / Bunker
aparecendo várias vezes — cada passo refina os dados um pouco mais.
Os colchetes no Pandas são como uma ferramenta são usados para criar novas colunas, isolar colunas, e selecionar linhas no DataFrame. Por exemplo:
emissoes_gases['Emissão / Remoção / Bunker']
seleciona só essa coluna para olhar os valores dela (como quando usamos .unique()
para ver as categorias: "Emissão
", "Remoção
", etc.).emissoes_gases[emissoes_gases['Emissão / Remoção / Bunker'] == 'Emissão']
, que mantém só as linhas onde a categoria é "Emissão
".Essa "repetição" acontece porque primeiro exploramos os dados e depois aplicamos filtros para limpá-los.
Um exemplo baseado em aulaemissoes_gases[emissoes_gases['Emissão / Remoção / Bunker'].isin(['Remoção NCI', 'Remoção'])]
Aqui, estamos pegando só as linhas onde a coluna Emissão / Remoção / Bunker
tem "Remoção NCI
" ou "Remoção
". O isin()
é uma forma mais simples de filtrar vários valores de uma vez, evitando escrever condições separadas com o operador lógico ==
(significa igual a.)
A ideia é ir ajustando os dados aos poucos:
.unique()
.Isso pode parecer repetitivo, mas é um processo comum em Data Science para garantir que os dados estejam certos antes de continuar a análise.
Ramon, agradeço por compartilhar sua experiência, ela é muito válida e nos ajudará em futuras melhorias me nossos conteúdos. Caso surja outras dúvidas, conte conosco para te auxiliar.
Bons estudos e até mais!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado!