1
resposta

[Dúvida] Problema no processamento e criação da coluna Tratamento_2

código:

pontuacao = list()

for ponto in punctuation:
  pontuacao.append(ponto)

pontuacao_stopwords = pontuacao + palavras_irrelevantes

frase_processada_2 = list()
for opiniao in resenhas['Tratamento_1']:
  nova_frase = list()
  palavras_texto = token_pontuacao.tokenize(opiniao)
  for palavra in palavras_texto:
    if palavra not in pontuacao_stopwords:
      nova_frase.append(palavra)
    frase_processada_2.append(' '.join(nova_frase))

resenhas['Tratamento_2'] = frase_processada_2

Erro:

ValueError                                Traceback (most recent call last)
<ipython-input-40-9e659ac2d0b7> in <cell line: 19>()
     17     frase_processada_2.append(' '.join(nova_frase))
     18 
---> 19 resenhas['Tratamento_2'] = frase_processada_2

3 frames
/usr/local/lib/python3.10/dist-packages/pandas/core/common.py in require_length_match(data, index)
    569     """
    570     if len(data) != len(index):
--> 571         raise ValueError(
    572             "Length of values "
    573             f"({len(data)}) "

ValueError: Length of values (8012479) does not match length of index (49459)

pelo o que eu entendi o erro é o tamanho final da variável frase_processada_2 mas não sei onde que ela está ficando maior do que deveria

1 resposta

Olá, Sandro! Tudo bem com você?

Desculpe pela demora em dar um retorno.

Somente com esse trecho de código não consegui identificar o problema encontrado por você, pois pode depender de passos anteriores.

Deixo como recomendação você verificar o notebook dessa aula que está disponível em notebook aula 04 e conferir o que está diferente do seu código para o do instrutor.

Importante ressaltar que estamos em processo de atualização dos cursos de NLP, em breve cursos mais atualizados estarão na plataforma.

Bons estudos.