O metodo bins='auto' do pandas é o mais eficiente para todos os casos?
O metodo bins='auto' do pandas é o mais eficiente para todos os casos?
Ei! Tudo bem, Cleiton?
O parâmetro bins='auto'
do Pandas tenta escolher automaticamente o número de intervalos com base em heurísticas internas. Ele geralmente usa o método de Freedman-Diaconis ou uma variação para determinar a largura dos bins, o que é baseado na amplitude interquartil (IQR) e no tamanho da amostra. Isso funciona bem em muitos casos, mas não é universalmente o mais eficiente.
Existem outros métodos que podem ser mais adequados dependendo da natureza dos seus dados:
Com essas dicas você pode explorar diferentes formas e visualizar os resultados para ver qual deles representa melhor a distribuição dos seus dados. E não deixe de considerar o contexto e o que você deseja analisar ou destacar com o histograma.
Espero ter ajudado e qualquer dúvida, compartilhe no fórum.
Até mais, Cleiton!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado!