Sim, exatamente. Mesmo quando você define o mesmo random_state
, os resultados podem ser diferentes porque os métodos dados.sample()
e dados.Renda.sample()
estão selecionando amostras de diferentes partes do conjunto de dados original.
Quando você usa dados.sample(n = 200, random_state = 101)
, você está selecionando aleatoriamente 200 observações de todo o conjunto de dados, o que inclui todas as variáveis presentes no conjunto de dados original.
Mas, quando você usa dados.Renda.sample(n = 200, random_state = 101)
, você está selecionando aleatoriamente 200 valores apenas da variável Renda
. Isso significa que a amostra resultante terá apenas a variável Renda
, não incluindo as outras variáveis do conjunto de dados original.
Então, mesmo com o mesmo random_state
, as séries da variável Renda
serão diferentes entre dados.sample()
e dados.Renda.sample()
, o que pode levar a resultados diferentes ao calcular estatísticas sobre essas amostras.