1
resposta

Função SD do R da resultado do calculo feito passo a passo

Olá,

Estou com um problema, faço o calculo do desvio padrão passo a passo e o resultado que obtenho é diferente do calculo pelas funções sd() e var() do R

Passos:

dados <- c(38946,42420,49191,50430,50557,52580,53595,54135,60181,62076)
variacaoDados <- dados - mean(dados)
variacaoDados <- variacaoDados ^ 2
variancia <- mean(variacaoDados)
var(dados)
variancia
desvio <- sqrt(variancia)
sd(dados)
desvio

As chamadas para SD e VAR foram usadas para comparar os dados com os cálculos feitos.

Agradeço desde já.

Akauã Santos da Costa

1 resposta

Oi Akauã,

A diferença acontece pois as funções do R calculam a variância de uma amostra e não de uma população. É um pouco complicado entender porque há essa diferença, mas o ponto chave é que quando trabalhamos com amostras, temos que fazer estimativas.

Por exemplo, suponha que você vai fazer uma pesquisa para saber a altura dos brasileiros. Não será possível entrevistar toda a população, mas sim uma amostra dela (talvez alguns milhares de pessoas).

Com essa amostra, podemos estimar a média e variância da altura do brasileiro. Uma boa estimativa da média é apenas olhar a média da nossa pesquisa. No caso da variância, se tirarmos a variância com a fórmula da população (a que você utilizou), nós temos uma variância enviesada (a razão disso é matematicamente densa).

Para corrigir este viés, nós fazemos outro cálculo para a variância muito semelhante, com a diferença sutil de que no último passo, ao invés de dividir pelo tamanho da amostra n, nós dividimos por n - 1.