Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Loop feito para criar o DF amostras

Boa noite (tarde, manhã). Tudo bem? Estava brincando com o código que cria o loop:

for i in range(total_de_amostras): 
  _=dados.Idade.sample(n) 
  _.index = range(0, len(_))
  amostras['Amostra_' + str(i)] = _ 

E só de curiosidade eu removi a linha " .index = range(0, len())". O resultado é um DF com o mesmo shape do DF da aula, mas com todos os valores em NaN. O código feito na aula eu já entendi tranquilamente. Só gostaria de saber o porquê de remover essa linha não me da nenhum erro, mas me dá um DF nulo, onde foram parar todos os dados criados na linha "_=dados.Idade.sample(n) "?

obrigado e abraços

2 respostas
solução!

Bom dia Giuliano, tudo bem? Espero que sim!

Quando você não atualiza os índices, o DataFrame irá manter os índices da primeira sample() que foi realizada.

Portanto as próximas muito provavelmente pegarão registros com outros índices, visto que é uma amostra aleatória.

Pode ser que algum registro não esteja nulo, mas a maioria ficará constando como nulo. Vou colocar aqui a imagem de um DataFrame que fiz de exemplo:

DataFrame de exemplo com amostras

Repare que pela "sorte" as amostras 7 e 9 tiveram os mesmos registros selecionados com índices 66888 e 25589 respectivamente do que a amostra inicial, portanto apareceram no DataFrame.

Por isso, resetamos os índices de cada amostra para que todos tenham a mesma referência de índices.

Espero que tenha tirado sua dúvida.

Estou à disposição. Bons estudos!

Entendido!! Muito obrigado.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software