Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Resíduos de todo dataset

Como eu faço isso:

dataset['Y_previsto'] = resultado_regressao.predict() dataset

depois de criar um “dataset de treino e teste” com mais de 2 variáveis? Estou testando um dataset com os conhecimentos adquiridos até agora e não estou conseguindo solucionar sozinha. Gostaria de saber o resíduo de todo dataset, mas ele aparece um erro, pois ele testou somente 30% dos dados. O erro: ValueError: Length of values (15116) does not match length of index (21595)

1 resposta
solução!

Olá Tatiane, tudo bem? Espero que sim!

Se quiser ver o resíduo para todo o dataset, basta realizar a previsão em todo o conjunto de dados ao invés de apenas os dados de treino ou de teste.

Antes de realizar a separação entre treino e teste, você separou os dados em variáveis explicativas ( X ) e variável dependente ( Y ). As variáveis explicativas contemplam todos os dados do dataset, portanto basta passar X como previsão no método predict().

Bons estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software