1
resposta

Perfomance quando se tenta encontrar o Desvio Padrão em grandes volumes de dados

Boa noite, pessoal.

Na resolução do exercício "Calculando o desvio padrão #2", eu optei por fazer a fórmula da seguinte forma:

dataset2.query('(Sexo == "M")').std()

Entretanto, a resolução do exercício aconselhava

dataset.groupby(['Sexo']).std().loc['M']

Ambas trouxeram o mesmo resultado, entretanto eu gostaria de saber se a maneira que eu fiz tem algum impacto em perfomance em grandes volumes ou não.

Obrigado, Marcelo

1 resposta

Marcelo, não haverá uma grande perda de performance com grandes volumes de dados, a maneira como você fez não está errada, a maior questão é limpeza e código em baixo se você notar está mais limpo. Você resolveu de uma outra maneira, mas não relação de performance não terá impactos significativos.