Oi Alysson, imagine!
Acho que eu me perdi ali entre amostra e amostragem. :p
Na amostragem, definimos como vamos obter a amostra, então temos alguns métodos como os descritos neste documento. Mas até onde eu entendo, não temos como garantir uma confiabilidade na amostragem, apenas na amostra.
Se você quer garantir que a amostra tenha 95% de confiança, vai precisar definir qual o tamanho dessa amostra, qual o desvio padrão, qual a margem de erro (que deve ser de 5%) dela e um valor padronizado chamado de z score (standard score ou valor z).
Uma vez definido o tamanho da sua amostra para garantir os 95%, você segue normalmente pegando a amostra e fazendo a limpeza dos dados.
Se quiser fazer a conta do cálculo do tamanho da amostra manualmente, pode fazê-la como descrita aqui
Nessa conta, o z score é como se fosse a média de desvios padrão da sua amostra, a parte boa é que o cálculo depende do nível de confiança que você quer, então já há tabelas prontas. Para 95%, o z score é geralmente de mais ou menos 1.96 (para uma distribuição normal).
Caso queira calculá-lo, você pode ver o cálculo dele aqui.
E para fazer o cálculo no R, você tem 2 caminhos, ou fazendo a conta:
(população-mean(população))/sd(população)
ou usando a função scale():
scale(população,center=TRUE,scale=TRUE)
E para fazer a conta do tamanho da amostra,
((zScore)^2)*desvioPadrão*(1-desvioPadrão)/((margemDeErro)^2)
Além disso, tem algumas calculadoras online que fazem a conta do tamanho da amostra pra você.
Uma delas é essa do survey monkey.
Qualquer outra dúvida, só seguir por aqui.