Ei, Rossan! Tudo bem?
Agradeço por compartilhar o seu feedback e eu te entendo. É um conteúdo denso, além de ter termos estatísticos, várias formas para chegar no que se precisa para entender melhor o que foi feito.
A ideia é mostrar como o o NumPy facilita esses cálculos na prática, mas sem uma base sólida em regressão linear, o conteúdo pode mesmo parecer um pouco desconectado.
Sobre o gráfico: é certo o que disse, um bom gráfico precisa de legibilidade e contexto para fazer sentido em uma apresentação.
Quando o eixo x mostra valores como 20 a 80, mas não explicita o que representam (idade? tempo? índice?), isso pode gerar confusão. Uma sugestão é incluir plt.xlabel("Nome da variável")
e plt.ylabel("Valor estimado")
para dar sentido ao gráfico.
<pre><code>
import matplotlib.pyplot as plt
import numpy as np
x = np.array([20, 30, 40, 50, 60, 70, 80])
y = np.array([100, 110, 125, 145, 160, 170, 180])
plt.scatter(x, y)
plt.plot(x, y, color='red')
plt.xlabel("Idade dos entrevistados")
plt.ylabel("Renda estimada (mil)")
plt.title("Relação entre Idade e Renda")
plt.grid(True)
plt.show()
</code></pre>
Se deseja aprofundar um pouco mais para conhecer a estatísticas e regressão linear, recomendo alguns conteúdos.
E caso ao decorrer dos estudos tenha dúvidas, não deixe de compartilhar no fórum essa dúvida pontual. Assim conseguimos te auxiliar durante aquele momento de estudos para a absorção ficar mais fluida do conteúdo.
Conte sempre conosco por aqui, ta!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado!