Perfomance quando se tenta encontrar o Desvio Padrão em grandes volumes de dados

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

Referente ao curso Estatística com Python: frequências e medidas, no capítulo Medidas de dispersão e atividade Calculando o desvio padrão #2

por Marcelo Lora de Oliveira

| 85.3k xp | 5 posts

Boa noite, pessoal.

Na resolução do exercício "Calculando o desvio padrão #2", eu optei por fazer a fórmula da seguinte forma:

dataset2.query('(Sexo == "M")').std()

Entretanto, a resolução do exercício aconselhava

dataset.groupby(['Sexo']).std().loc['M']

Ambas trouxeram o mesmo resultado, entretanto eu gostaria de saber se a maneira que eu fiz tem algum impacto em perfomance em grandes volumes ou não.

Obrigado, Marcelo

1 resposta

por VINICIUS ALVES SOUSA

| 68.4k xp | 10 posts

08/06/2021

Marcelo, não haverá uma grande perda de performance com grandes volumes de dados, a maneira como você fez não está errada, a maior questão é limpeza e código em baixo se você notar está mais limpo. Você resolveu de uma outra maneira, mas não relação de performance não terá impactos significativos.

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP