Nos exemplos utilizados.. quando divido meus datasets em treino e teste, para que serve, e o que seria a parte referente a labels? Seria meu Y? Porque tenho que ter o X e o Y para o Teste e para o Treino, não bastaria apena pro treino ??
Poderia me explicar melhor sobre o algoritmo(função) "train_test_split" ??
# Split dos datasets em treino e teste
treino, teste, treino_labels, teste_labels = train_test_split(filmes_caract, filmes_labels)