Olá, Elton. Tudo bem?
Com relação à sua primeira pergunta, em geral, a maneira como você codifica a sua variável de classificação (0 e 1 para falso e verdadeiro, respectivamente) não deve interferir na performance do seu modelo. Isso porque a maioria dos algoritmos de machine learning, incluindo os usados para processamento de linguagem natural, são capazes de lidar com essa codificação binária.
No entanto, é sempre importante lembrar que cada problema é único e pode haver nuances que podem fazer com que certas abordagens funcionem melhor do que outras. Por exemplo, em alguns casos, pode ser útil codificar a sua variável de classificação de uma maneira diferente, como -1 e 1, especialmente se você estiver lidando com um problema de classificação binária desbalanceada.
Quanto à sua segunda pergunta, sim, os conceitos que você aprendeu no curso podem ser aplicados para determinar se uma frase tem a ver com um determinado assunto. Por exemplo, você pode usar técnicas de NLP (Natural Language Processing) para extrair características das frases e então treinar um modelo de classificação para prever o assunto com base nessas características.
Um exemplo prático seria usar o TF-IDF (Term Frequency-Inverse Document Frequency) para transformar as frases em vetores numéricos, e então usar um algoritmo de classificação, como o Naive Bayes, para prever o assunto. Lembre-se sempre de validar o seu modelo usando uma métrica adequada, como a acurácia ou a AUC-ROC, para garantir que ele está performando bem.
Espero ter ajudado e bons estudos!