Tem algum problema para utilizar o agrupamento do GroupKfold com uma coluna que contém os labels dos meus dados clusterizados?
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Tem algum problema para utilizar o agrupamento do GroupKfold com uma coluna que contém os labels dos meus dados clusterizados?
Olá, Danival! Tudo tranquilo por aí?
Não há problema em seguir dessa forma que você está sugerindo. Em suma o que o professor está fazendo ao realizar a adição da coluna "modelo" é fazendo uma clusterização manual, pela idade do carro essa separação de modelo
Executar da forma que você está sugerindo, com algum algoritmo que realize essa clusterização pode até mesmo melhorar a acurácia do modelo, pois irá separar pelas características das suas amostras.
Espero ter ajudado, mas se ainda persistir alguma dúvida estou sempre à disposição.
:)