Caros, a definição de "max_features" do CountVectorizer É: "max_features: int or None, default=None If not None, build a vocabulary that only consider the top max_features ordered by term frequency across the corpus."
Oras, se é assim, porque não bate com o que foi obtido na aula "4.3 Tokenização - explorando o conceito", onde foi obtida a frequência do Corpus por meio da FreqDist do tokenize do nltk?