Oi, Eduardo! Tudo bem com você?
Desculpa a demora em te trazer um retorno.
No curso de Linguagem Natural parte 1: introdução a NLP com análise de sentimento o instrutor utiliza aprendizado supervisionado para treinar o modelo. Isso foi possível porque o dataset IMDB é rotulado e contém os sentimentos de cada critica. No seu caso, seu dataset não é rotulado, então não é possível fazer um aprendizado de forma supervisionada nele e nem aplicá-lo ao conteúdo deste curso, a não ser que você esteja disposto a colocar os sentimentos de cada dado.
Não considerando a última opção viável, no próprio curso de Linguagem Natural tem uma atividade que discute sobre os dados rotulados em Usando Dados Rotulados. Nessa atividade o instrutor explica a diferença entre tipos de dados e tipos de aprendizado e referências para estudo nos dois casos, os quais você pode consultar.
Bons estudos!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!