Boa tarde, tudo bem? Gostaria de entender melhor a geração dos indivíduos de uma amostra. Por exemplo, temos uma população e, ao criarmos uma amostra, gostaríamos que cada elemento da população tivesse as mesmas chances de serem selecionados para fazerem parte da amostra.
Passando isso para a ciências da computação, podemos utilizar funções que simulariam esse comportamento, como uma Seed do Numpy ou simplesmente utilizarmos o padrão random_state da função Sample.
A minha dúvida gira em torno da junção desses tópicos que citei. Como sabermos (seja utilizando uma Seed, um Sample ou qualquer outro código) que de fato cada elemento da população tem as mesmas chances de serem selecionados para fazer parte da amostra?
Esses códigos que citei, por na verdade serem pseudoaleatórios e sempre "seguirem um processo específico de acordo com seu parâmetro" seria o que garante as mesmas chances para cada elemento todas as vezes?
Grato desde já pessoal, abraços!