1
resposta

Dúvida conceitual: tamanho de amostra população finita

Estou com uma dúvida conceitual sobre o tema. Eu entendo que, quando estamos falando de populações infinitas (olhando o conjunto de dados do IBGE, por exemplo), eu posso fazer algo como

dados.Renda.std()

para obter o desvio-padrão e tal.

O que eu não entendo é na questão do exemplo da amostra populacional finita. Repetindo o enunciado do exemplo:

"Em um lote com 10.000 latas foi realizada uma amostra aleatória simplesde 100 latas e foi obtido o desvio padrão amostral do conteúdo das latas igual a 12 ml [...]"

Nesse caso, como exatamente eu sei calcular esse valor de desvio padrão das latas? Digo, o problema não remete exatamente a como calcular o tamanho necessário para que a amostra represente bem a população? Então por que eu, antes de calcular esse número, seleciono uma amostra de tamanho 100 (aparentemente sem justificativa prévia) e calculo o desvio-padrão amostral associado a essa amostra preliminar? Em suma, por que selecionamos uma amostra de 100 latas para calcular o desvio-padrão amostral?

Obs.: se a resposta for algo como "porque eu preciso de uma amostra preliminar para calcular o desvio padrão amostral e determinar o tamanho da amostra posterior", eu pergunto uma outra coisa: se eu selecionasse 10 latas e calculasse o desvio-padrão amostral dessas 10, eu assumiria como o desvio-padrão amostral e utilizaria igual utilizamos quando foram selecionadas 100 latas?

1 resposta

Olá Jorge, tudo bem? Espero que sim!

Desculpe pela demora em retornar.

Quanto maior o tamanho da amostra, maior será a chance de essa amostra representar a população e não ser uma mera coincidência. É estipulado um número mínimo do tamanho da amostra, n = 30. Portanto, realizar uma amostra de apenas 10 latas muito provavelmente traria um resultado muito distante da realidade.

Portanto quanto maior possível for a sua amostra inicial, melhor será o resultado da sua estimativa de tamanho da amostra. O valor de n = 100 latas é significativo ( n > 30 ) e pôde ser feito como experimentação sem trazer grandes perdas, logo foi possível estipular um tamanho de amostra através dele. Mas se fosse realizado um experimento com uma amostra maior, provavelmente traria uma aproximação ainda melhor. A questão é a dificuldade e custo para realizar experimentações com amostras muito grandes.

Bons estudos!