1
resposta

[Dúvida] Por que desvio ao quadrado?

Eu queria levantar uma dúvida filosófica aqui: Se o que importa para a medida de dispersão é que o somatório (ou integral no caso contínuo) seja sobre uma função do desvio (amostra menos média) que torne tudo positivo, por que usar a função quadrática? Me parece que existe uma opção muito mais natural que é usar a função exponencial exp(x), daí teríamos var_e(X) = E[exp(X-E[X])] onde E é o operador de Expectativa, dessa forma o desvio padrão seria o logarítimo natural de var_e(X) que também estaria na mesma unidade. Me parece que teriam até mais propriedades interessantes se fosse dessa forma, por exemplo, se X e Y são variáveis aleatórias independentemente distribuídas std_e(X+Y) = std_e(X) + std_e(Y) (se eu não errei minhas contas), ou seja, o desvio padrão assim como a média seria um operador linear.

std_e(X+Y)

= ln E[exp(X+Y - E[X+Y])]

= ln E[exp(X-E[X]+Y- E[Y])] (porque E é linear)

= ln E[exp(X-E[X]) exp(Y- E[Y])]

= ln E[exp(X-E[X]) + ln E [exp(Y- E[Y])] (porque exp é uma função separável)

= std_e(X) + std_e(Y)

1 resposta

Opa, Lucas, tudo bem por aí? ^_^

A razão pela qual usamos o quadrado dos desvios em vez de outras funções, como a exponencial que você sugeriu, tem a ver com algumas propriedades matemáticas e práticas desejáveis que o quadrado dos desvios oferece.

Vou deixar aqui alguns dos motivos - com certeza não são todos, mas já dá pra te dar uma ideia, ok?

Facilidade de cálculo: O cálculo do quadrado é mais simples do que o cálculo da função exponencial.

Diferenciabilidade: A função quadrática é diferenciável em todos os pontos, o que facilita o cálculo de mínimos e máximos em otimização, um campo que é frequentemente aplicado em estatística.

Interpretação: O quadrado dos desvios (e sua raiz quadrada, o desvio padrão) tem uma interpretação intuitiva e direta em termos de distância.

Em relação à sua sugestão de usar a função exponencial, ela é realmente utilizada em algumas áreas da estatística, especialmente na estatística bayesiana e na teoria da informação.

No entanto, a abordagem que você propôs, embora seja matematicamente válida, pode levar a algumas propriedades indesejáveis. Por exemplo, a variância exponencial e o desvio padrão exponencial que você definiu não são finitos para todas as distribuições. Além disso, eles não são invariantes sob mudanças de escala, o que é uma propriedade desejável em muitas aplicações.

Espero que essas explicações esclareçam um pouco o motivo pelo qual usamos o quadrado dos desvios na estatística. É uma combinação de conveniência matemática, interpretabilidade e algumas propriedades desejáveis que o quadrado dos desvios oferece.

Abraços e bons estudos! Obrigada pela dúvida filosófica, hehehe.

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.