Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

informações nos eixos do gráfico

Curso de Regressão Linear Se y_previsto_train e y_train são vetores unidimensionais, ou seja, não possuem o par abscissa e ordenada, como é possível plotar um gráfico onde o eixo X varia em "Consumo em Litros - Previsão" com observações que estão além de 35000L, se em nenhum dos dois vetores há esse valor? Qual é o vetor da abscissa e qual é o vetor da ordenada?

ax = sns.scatterplot(x=y_previsto_train, y=y_train)
ax.figure.set_size_inches(12, 6)
ax.set_title('Previsão X Real', fontsize=18)
ax.set_xlabel('Consumo de Cerveja (litros) - Previsão', fontsize=14)
ax.set_ylabel('Consumo de Cerveja (litros) - Real', fontsize=14)
ax
1 resposta
solução!

Oi Thiago,

Nesta célula estamos plotando um gráfico de dispersão utilizando a função scatterplot do seaborn (https://seaborn.pydata.org/generated/seaborn.scatterplot.html). Nesta função precisamos passar as duas variáveis que vão estar nos eixos x (abscissa) e y (ordenada) da seguinte forma:

ax = sns.scatterplot(x = 'Variável do Eixo X', y = 'Variável do Eixo Y')

Em nosso exemplo plotamos y_previsto_train no eixo x e y_train no eixo y.

ax = sns.scatterplot(x = y_previsto_train, y = y_train)

Com relação aos valores acima de 35000 litros, em meu exemplo de aula eles existem. Verifique os valores máximos de cada variável e compare com os meus.

y_previsto_train.max()

Out[1]: 35866.63564960831

y_train.max()

Out[2]: 37690

Caso esteja encontrando valores diferentes dos meus verifique se utilizou, na função train_test_split do scikitlearn, o mesmo random_state que utilizei (2811).

Espero ter ajudado