Estou com dúvidas se fiz o que era esperado.
.
A seguir, apresento o código que utilizei para realizar a análise de dados das laranjas (diâmetro versus peso), incluindo a linha da norma (se eu entendi corretamente o significado dessa linha que atravessa o gráfico).
.
url = 'https://raw.githubusercontent.com/allanspadini/numpy/dados/citrus.csv'
dados = np.loadtxt(url,
delimiter=',',
skiprows=1,
usecols=np.arange(1,6,1)
dados_t = dados.T
diametro_laranja = dados_t[0, :5000]
peso_laranja = dados_t[1, :5000]
# Variáveis Laranja
nl = np.size(diametro_laranja)
xl = diametro_laranja
yl = peso_laranja
# Coeficiente Angular Laranja
coef_ang_laranja = (nl * np.sum(xl * yl) - np.sum(xl) * np.sum(yl)) / (nl * np.sum(xl**2) - (np.sum(xl))**2)
# Saída: 14.7997452319846
# Coeficiente Linear Laranja
coef_lin_laranja = np.mean(yl) - coef_ang_laranja * np.mean(xl)
# Saída: 27.38560381218413
# Norma Laranja
norma_laranja = coef_ang_laranja * diametro_laranja + coef_lin_laranja
# Saída: [ 71.1928497 85.25260767 92.80047774 ... 213.12240647 216.08235552 217.85832495]
# Gráfico com a norma
plt.plot(xl, yl)
plt.plot(xl, norma_laranja)
.
Era esse o resultado esperado?
.
Obs.: optei por não realizar a parte da "Estimativa através de Números Aleatórios" porque não consegui entender o objetivo da prática. Portanto, não achei útil. Se possível, gostaria de obter uma explicação mais detalhada sobre o assunto.
.