Olá, ao utilizar a função FreqDist para mostrar a frequência das palavras que mais aparecem no Dataset, o resultado que obtive não estava ordenado pelo maior número de ocorrência, como mostrado na aula.
token_frase = token_espaco.tokenize(todas_palavras)
frequencia = nltk.FreqDist(token_frase)
frequencia
FreqDist({'Mais': 1538,
'uma': 130888,
'vez,': 1927,
'o': 244881,
'Sr.': 1741,
'Costner': 50,
'arrumou': 3,
'um': 216410,
'filme': 117543,
'por': 61339,
'muito': 51761,
'mais': 53504,
'tempo': 10424,
'do': 101737,
'que': 325070,
...