Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Dúvida] Resultado alcançado no Projeto

Estou com dúvidas se fiz o que era esperado.

.

A seguir, apresento o código que utilizei para realizar a análise de dados das laranjas (diâmetro versus peso), incluindo a linha da norma (se eu entendi corretamente o significado dessa linha que atravessa o gráfico).

.

url = 'https://raw.githubusercontent.com/allanspadini/numpy/dados/citrus.csv'

dados = np.loadtxt(url, 
                   delimiter=',', 
                   skiprows=1, 
                   usecols=np.arange(1,6,1)

dados_t = dados.T

diametro_laranja = dados_t[0, :5000]
peso_laranja = dados_t[1, :5000]

# Variáveis Laranja
nl = np.size(diametro_laranja)
xl = diametro_laranja
yl = peso_laranja

# Coeficiente Angular Laranja
coef_ang_laranja = (nl * np.sum(xl * yl) - np.sum(xl) * np.sum(yl)) / (nl * np.sum(xl**2) - (np.sum(xl))**2)
# Saída: 14.7997452319846

# Coeficiente Linear Laranja
coef_lin_laranja = np.mean(yl) - coef_ang_laranja * np.mean(xl)
# Saída: 27.38560381218413

# Norma Laranja
norma_laranja = coef_ang_laranja * diametro_laranja + coef_lin_laranja
# Saída: [ 71.1928497   85.25260767  92.80047774 ... 213.12240647 216.08235552 217.85832495]

# Gráfico com a norma
plt.plot(xl, yl)
plt.plot(xl, norma_laranja)

Insira aqui a descrição dessa imagem para ajudar na acessibilidade.

Era esse o resultado esperado?

.

Obs.: optei por não realizar a parte da "Estimativa através de Números Aleatórios" porque não consegui entender o objetivo da prática. Portanto, não achei útil. Se possível, gostaria de obter uma explicação mais detalhada sobre o assunto.

.

Obrigado pela atenção

1 resposta
solução!

Boa tarde Mikael, como vai?

O gráfico e o código estão corretos!

Esse gráfico mostra a relação entre peso e diâmetro de laranjas (linha azul) e sua normalização (linha laranja). A normalização é um processo que ajusta os valores de um conjunto de dados para uma escala comum, uma reta. Aqui estão algumas conclusões que podemos tirar desse gráfico:

  1. Tendência Geral: Ambas as linhas seguem uma tendência linear crescente, o que indica que, à medida que o diâmetro das laranjas aumenta, o peso também aumenta de forma proporcional.

  2. Correlação: A linha laranja (normalização) está muito próxima da linha azul (dados originais), sugerindo que os dados normalizados mantêm a mesma tendência e correlação do conjunto de dados original.

  3. Consistência dos Dados: A proximidade entre a linha azul e a linha laranja indica que a normalização foi bem-sucedida e não alterou significativamente a estrutura dos dados. Isso é importante para garantir que qualquer análise posterior baseada nos dados normalizados ainda seja representativa dos dados reais.

  4. Possíveis Outliers: A linha azul apresenta alguns pontos onde há pequenos saltos ou desvios em relação à linha laranja, o que pode indicar a presença de outliers ou variações específicas que não seguem a tendência linear perfeitamente.

  5. Uso da Normalização: A normalização facilita a comparação dos dados com outros conjuntos de dados ou a aplicação de algoritmos de aprendizado de máquina que exigem dados em escalas semelhantes.

Em resumo, o fato das 2 linhas estarem muito próximos indicada uma forte correlação entre peso e diâmetro! Espero ter ajudado!