Tem algum problema para utilizar o agrupamento do GroupKfold com uma coluna que contém os labels dos meus dados clusterizados?
Tem algum problema para utilizar o agrupamento do GroupKfold com uma coluna que contém os labels dos meus dados clusterizados?
Olá, Danival! Tudo tranquilo por aí?
Não há problema em seguir dessa forma que você está sugerindo. Em suma o que o professor está fazendo ao realizar a adição da coluna "modelo" é fazendo uma clusterização manual, pela idade do carro essa separação de modelo
Executar da forma que você está sugerindo, com algum algoritmo que realize essa clusterização pode até mesmo melhorar a acurácia do modelo, pois irá separar pelas características das suas amostras.
Espero ter ajudado, mas se ainda persistir alguma dúvida estou sempre à disposição.
:)