Oi, Maria Fernanda, tudo bem?
Muito obrigado pelo feedback, ele é muito importante para manter o desenvolvimento dos nossos conteúdos e levar experiências repletas de aprendizagens para nossas alunas e alunos.
Além disso, fico muito feliz que esteja interessada em compreender como atingir resultados semelhantes com as funções apresentadas no aviso. Vou demonstrar como utilizar o histplot
uma das funções mencionadas.
Usaremos como exemplo a avaliação da variável Renda até 20.000 reais. Ao aplicar o distplot
, que gera o aviso, o código é escrito da seguinte maneira:
ax = sns.distplot(dados.query('Renda < 20000').Renda)
ax.figure.set_size_inches(12, 6)
ax
O resultado do gráfico é apresentado abaixo:
Usando a função histplot
é responsável por gerar histogramas para demonstrar a distribuição de uma dada variável num DataFrame.
Um histograma é uma ferramenta visual clássica que apresenta a distribuição de nossos dados contando o número de observações presentes dentro de certos intervalos (bins
).
Como no nosso caso queremos normalizar os nossos dados para apresentarmos a densidade deles (área total do histograma igual a 1), utilizaremos o parâmetro estatístico de densidade (stat = "density"
) .
O parâmetro kde=True
serve para gerarmos a curva gaussiana estimada que representa a distribuição dos nossos dados. É a partir dessa curva que iremos observar e verificar a sua simetria/assimetria conforme a abordagem do professor nesse curso.
Assim, um código adaptado possível para usar o histplot
no lugar do distplot
seria:
# Método Histplot
#
# Parâmetros: stat = estatística agregada a função --> "density" (densidade) o padrão é "count" (contagem)
# element = modo de exibição dos elementos (bins) --> "step" (degraus) o padrão é "bars" (barras)
# bins = número de intervalos desejados --> o padrão é "auto"
# kde = curva que caracteriza a distribuição --> o padrão é False
# color = cor dos dados(hexadecimal ou seguindo a biblioteca matplotlib)
# lw = espessura da linha dos intervalos (zerei para não ter espessura)
ax = sns.histplot(dados.query('Renda < 20000').Renda, stat="density", element="step", bins=50, kde=True, color='#74acd4', lw=0)
ax.figure.set_size_inches(12, 6)
ax
O gráfico gerado a partir desse código é:
Fique a vontade para modificar os parâmetros e testar diferentes configurações para experimentar essa função e suas potencialidades. Também recomendo que você dê uma lida na documentação do histplot
e do displot
da biblioteca seaborn para possíveis consultas e testes:
Espero ter ajudado. Caso tenha dúvidas, não hesite em postar no fórum!
Abraços e bons estudos!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!