1
resposta

[Dúvida] Segunda linha do código

RESPOSTA CORRETA:

sexo = alunos.groupby('Sexo')
sexo = pd.DataFrame(sexo['Notas'].mean().round(2))
sexo.columns = ['Notas Médias']
sexo

Olá, alguém poderia me explicar pq ele criou um DataFrame? Não entendi essa parte da segunda linha do código.

1 resposta

Olá Nairim, tudo bem com você?

Peço desculpas pela demora em obter um retorno.

A criação de um DataFrame na segunda linha do código é feita para transformar os resultados obtidos com a operação groupby em um formato tabela, que é mais fácil de manipular e visualizar.

No primeiro passo, alunos.groupby('Sexo'), o código está agrupando o DataFrame de alunos por 'Sexo'. Isso significa que ele está criando grupos separados para cada sexo distinto encontrado na coluna 'Sexo' do DataFrame alunos.

O próximo passo, sexo['Notas'].mean().round(2), está calculando a média das "Notas" para cada um desses grupos e arredondando o resultado para duas casas decimais (.round(2)).

No entanto, o resultado dessa operação é uma Series do Pandas, que é essencialmente uma coluna única. Para transformar essa Series em um DataFrame (que pode ter várias colunas), usamos pd.DataFrame(). Isso facilita a manipulação posterior dos dados, como a renomeação da coluna para 'Notas Médias' na linha seguinte (sexo.columns = ['Notas Médias']). Obtendo assim o seguinte resultado:

    Notas Médias
Sexo	
F	5.82
M	7.12

Espero ter ajudado. Continue mergulhando em conhecimento e não hesite em voltar ao fórum para continuar aprendendo e interagindo com a comunidade.

Em caso de dúvidas estou à disposição.

Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software