Acredito que pela quantidade de dados, o código do tfidf não rodou no colab. Há alguma forma que demande menos para rodar, ou o meu código está errado? utilizei o código abaixo:
tfidf_tratado = tfidf.fit_transform(resenha['tratamento_5'])
treino, teste, classe_treino, classe_teste = train_test_split(tfidf_tratado,
resenha['tratamento_5'],
random_state = 42)
regressao_logistica = LogisticRegression()
regressao_logistica.fit(treino, classe_treino)
acuracia_tfidf_tratado = regressao_logistica.score(teste, classe_teste)
print(acuracia_tfidf_tratado)