Olá, pessoal!
Estou "quebrando" a cabeça com um desafio:
- Considere o código abaixo para responder as próximas 2 perguntas:
import pandas as pd
def somefunction (df, column1, column2):
return df.groupby(column1)[column2].mean()
data= pd.DataFrame({'Escolaridade':['Ensino Medio', 'Ensino Fundamental','Ensino Medio','Ensino Superior', 'Ensino Superior','Ensino superior'], 'Idade':[35, 40, 20, 33, 35, 21]})
print (somefunction(data, 'Escolaridade', 'Idade'))
Resultado:
Escolaridade
Ensino Fundamental 40.0
Ensino Medio 27.5
Ensino Superior 34.0
Ensino superior 21.0
Name: Idade, dtype: float64
Pergunta:
Da forma como o código acima está, a escolaridade "Ensino Superior" aparece duas vezes por conta de um dos casos estar com "superior" com letra minúscula. Modifique a função "somefunction" acima para que ela faça o agrupamento de todos os casos de "Ensino Superior" juntos.
Não estou conseguindo montar um groupby sem erro... :/