Olá Amauri, se for um sorteio aleatório de um conjunto de N palavras a probabilidade será realmente igual para todas 1/N. Mas neste caso a probabilidade depende do seu "conhecimento" e tbm considera o contexto!
Quantas vezes que vc ouviu a frase "Luke, eu sou seu pai" e quantas vezes vc ouviu "Luke, eu sou seu tio"?
Você está precisa "calcular" a probabilidade levando em consideração as palavras que vem antes e seu "conhecimento". O conhecimento do modelo de linguagem é os dados que vc está usando para criar o modelos, assim ele calcula as probabilidades, já o seu conhecimento vem das suas experiências de vida e é assim que na sua cabeça (de uma forma bem simplista) diz para você que a chance da palavra a ser preenchida é pai e não tio!
Abraços e bons estudos!