Boa noite, já vimos em outros cursos algumas ferramentas que dividem o conjunto de dados em teste e treino, como o train_test_split. Por que dessa vez foi feito de uma forma mais manual, definindo um ponto e dividindo o conjunto a partir dali?
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Boa noite, já vimos em outros cursos algumas ferramentas que dividem o conjunto de dados em teste e treino, como o train_test_split. Por que dessa vez foi feito de uma forma mais manual, definindo um ponto e dividindo o conjunto a partir dali?
Olá, Vinícius! Tudo bem com você?
Poderia ser utilizado sim o train_test_split, porém esse método divide o conjunto de dados de forma aleatória, conforme nos afirma a documentação, ou seja, não temos um controle sobre qual parte será utilizada para treino e qual será teste. Como o instrutor tinha o objetivo de plotar o gráfico de treino junto com o de teste, para analisar como a curva se ajusta a esses dois conjuntos de dados em um mesmo gráfico, fica mais didático e de melhor visualização separar a parte final do dataset para teste e assim plotar o gráfico, ficando a parte final destacada em outra cor. Caso essa não fosse sua intenção, você poderia utilizar o train_test_split, conforme exemplificado em outros cursos.
Espero ter ajudado, mas se ainda persistir alguma dúvida estou sempre à disposição.
:)