Olá Julia, tudo bem ? Espero que sim.
As técnicas que estamos aprendendo nesse curso estão voltadas a tratar nosso dataset de maneira que nosso modelo treinado com esses dados tenha maior precisão, então a cada tratamento esperamos que nosso acerto aumente.
Mas como exatamente podemos tratar e onde podemos tratar ? Uma maneira de encontrar essas respostas é olhando para a nossa nuvem de palavras, então no momento que o instrutor está ensinando como separar as resenhas positivas e negativas é para podermos notar que as palavras que estão em destaque não são as que gostaríamos, isso indica que ainda é necessário fazer tratamentos no nosso texto.
Entendo que conforme avançar no curso vai ficar mais claro, por exemplo, o instrutor após fazer um tratamento vai imprimir uma nova nuvem de palavras e as palavras que gostaríamos vão começar a ficar em evidencia, nas resenhas positivas palavras como ótimo e bom e nas resenhas ruins palavras como ruim e péssimo.
Então estamos sim tentando chegar em um modelo que consiga classificar qualquer resenha que seja apresentada a ele, mas antes disso vamos explorar o nosso dataset para poder trata-lo e então o modelo poderá aprender melhor com os nosso dados.
Espero ter ajudado a esclarecer, mas qualquer duvida não hesite em perguntar.
Bons Estudos.
: )