1
resposta

Estimar e Coeficiente de determinação

Nós criamos o modelo e fizemos um fit, para que nosso modelo possa ser estimado com os dados de treino "70%" do nosso dataset.

A minha questão esta relacionada no calculo do coeficiente de determinação e previsão do consumo "predict", porque não usamos apenas os dados de treino? Tivemos que referenciar treino e testes?

Fiquei confuso.

Grato.

1 resposta

Olá JavaScriptOcara, blz??

Não assisti a aula que você está se referindo, mas vou tentar explicar usando o que sei, blza?

A ideia de separar os dados em treino e teste é para podermos validar o modelo na amostra de validação. Funciona da seguinte forma:

1) Separar o conjunto de dados em Treino e teste
2) Estimar o modelo a partir dos dados de Treino
3) Usar o modelo estimado anteriormente e testá-lo suando as variáveis de entrada e labels do teste.

Você pode sim treinar o modelo usando os dados do Treino e Testar no mesmo conjunto de dados, da mesma forma que também pode calcular o Coef. de determinação usando apenas os dados de treino. Mas o interessante é fazer o que eu listei acima, pois dessa forma você consegue verificar se seu modelo consegue generalizar para os dados que ele não 'conhece'.

Abs

Ass.: PythonCrazyBabilonia