Ajuda! Resultado diferente. | Corretor Ortográfico em Python: aplicando técnicas de NLP | Alura - Cursos online de tecnologia

2
respostas

por Tamires dos Santos Machado

| 58.9k xp | 1 posts

with open("dados/artigos.txt", "r" , encoding='utf8') as f:
    artigos = f.read()

import nltk
nltk.download('punkt')

def separa_palavras(lista_tokens):
    lista_palavras = []
    for tokens in lista_tokens:
        if tokens.isalpha():
            lista_palavras.append(tokens)
    return lista_palavras

tokens_artigos = nltk.tokenize.word_tokenize(artigos)

separa_palavras(tokens_artigos)

len(separa_palavras(tokens_artigos))

Meu resultado foi 403106, não entendi o motivo da diferença, alguém poderia me ajudar por favor?

Obrigada.

2 respostas

por Estudante

| 685.5k xp | 57 posts

15/04/2021

Executei o código exatamente como o instrutor e o meu também deu 02 palavras a menos: 393.914. Se alguém souber, nos avise aqui ;-)

por Gabriel Moreira Silva

| 214.5k xp | 1 posts

28/04/2021

Eu rodei seu código usando o Colab, e o número bateu exatamente com o do professor na aula

Você está usando qual framework para rodar o código?