ax = sns.boxplot(data=df, x='valor')
ax.figure.set_size_inches(15, 6)
ax.set_title('Valor dos imóveis', fontsize=20)
ax.set_xlabel('Valor', fontsize=14)
plt.show();
O gráfico revela um mercado com alta concentração de imóveis em faixas de preço baixas, mas com uma presença massiva de outliers que estendem a escala até 25.000, indicando uma forte desigualdade de valores no conjunto de dados.
ax = sns.histplot(data=df, x='valor', kde=True)
ax.figure.set_size_inches(15, 6)
ax.set_title('Distribuição de frequências', fontsize=20)
ax.set_xlabel('Valor do imóvel', fontsize=14)
plt.show();
O gráfico mostra uma distribuição assimétrica à direita, onde a grande maioria dos imóveis está concentrada em valores baixos (abaixo de R$2.500), enquanto uma minoria de imóveis de luxo cria uma "cauda" longa que se estende até o valor de R$25.000.
ax = sns.pairplot(data=df, y_vars='valor', x_vars=['area', 'dist_praia', 'dist_mercado', 'piscina'], kind='reg', plot_kws={'line_kws': {'color': 'red'}})
ax.figure.suptitle('Gráfico de dispersão das variáveis', fontsize=20, y=1.05)
plt.show()
O gráfico de dispersão múltiplo demonstra que o valor do imóvel é fortemente determinado pelo aumento da área e pela proximidade com a praia, enquanto a distância do mercado e a presença de piscina mostram uma influência visualmente menor ou mais restrita.