0
respostas

[Sugestão] Exercício

Durante esta etapa da análise, utilizamos o gráfico de distribuição (displot) da biblioteca Seaborn para observar o comportamento da variável resposta preco_de_venda. O código aplicado foi:

sns.displot(dados['preco_de_venda'], kde=True, color='green')
plt.title('Distribuição do preço de venda')
plt.show()

Distribuição do Preço de Venda
Essa visualização permitiu identificar uma assimetria positiva na distribuição dos dados, ou seja, a cauda do histograma está mais alongada à direita. Isso indica a presença de imóveis com preço de venda significativamente mais alto do que a maioria, caracterizando a existência de valores extremos no conjunto de dados.

Essa característica é relevante, pois uma distribuição assimétrica pode afetar negativamente o desempenho de modelos estatísticos como a regressão linear, que pressupõem uma distribuição aproximadamente normal dos resíduos. Portanto, compreender e visualizar essa assimetria é uma etapa importante da análise exploratória, pois permite avaliar a necessidade de futuras transformações nos dados para melhorar a performance do modelo e a interpretação dos resultados.