0
respostas

[Dúvida] Dúvida no calculo da variância

Bom dia,

A fim de evitar o for, acabei prosseguindo com a criação de um DataFrame com os dados dos centroid:

centroids1 = pd.DataFrame(centroids)
colunas = list(dados.drop(columns = ['cluster']))
centroids1.set_axis(colunas, axis = 'columns', inplace = True)
centroids1

Tive de retorno um DF com dados similares ao centroid, porém em uma estrutura de DF.

Contudo, ao extrair a variância dos meus dados, os valores divergem, segue calculo:

Imagem com pedaço de código onde mostrar o print dos dados do centroid diferente de quando os dados são colocados em um DF

Após analisar, percebi que os dados do DF estão arredondados, alguém saberia me explicar porque isso acontece? Se eu manter a análise dessa forma, posso sair prejudicado em aplicações futuras?