Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Duvida sobre o algoritmo train_test_split

Nos exemplos utilizados.. quando divido meus datasets em treino e teste, para que serve, e o que seria a parte referente a labels? Seria meu Y? Porque tenho que ter o X e o Y para o Teste e para o Treino, não bastaria apena pro treino ??

Poderia me explicar melhor sobre o algoritmo(função) "train_test_split" ??

# Split dos datasets em treino e teste
treino, teste, treino_labels, teste_labels = train_test_split(filmes_caract, filmes_labels)
2 respostas
solução!

Olá Givaldo,

Desculpe a demora na resposta:

Exatamente. Os labels são o y da base de dados. Devem ser as categorias da base de dados.

Uma forma de escrever a linha de código que passou com outros nomes:

x_treino, x_teste, y_treino, y_teste = train_test_split(x, y)

E você tem que ter o x e o y para o teste porque o y é uma forma de verificar se o seu modelo não resolve o problema apenas para os dados de treino. Queremos que o modelo final seja uma generalização do problema.

Ok,

Obrigado!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software