Problemas com Encoding mesmo depois de colocar 'utf-8'

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

Referente ao curso Python: avançando na linguagem, no capítulo Escrita e leitura de arquivos e atividade Escrevendo em um arquivo

por Alan da Motta Maio

| 84.7k xp | 7 posts

Vi que mais pessoas tiveram problemas com o encoding='cp1252'. Uma solução proposta foi especificar o encoding no momento que utilizar a função open ( arquivo = open("palavra.txt", "r", encoding="utf-8")). Porém, quando faço isso, aparece essa mensagem quando rodo o programa:

(result, consumed) = self.bufferdecode(data, self.errors, final) UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe1 in position 39: invalid continuation byte

1 resposta

por Bruno Barreto Rodrigues

| 120.1k xp | 74 posts

18/04/2021

Codecs são quase um trauma... sempre que trabalho com textos acabo investindo um bom tempo tratando o código até achar o codec correto.

Na maioria dos casos eu eu adiciono um "encode" e depois um "decode", sugiro utilizar encode('raw_unicode_escape') nas suas strings. Ex:

result = texto # se isso dá UnicodeDecodeError

result = texto.encode('raw_unicode_escape').decode('utf-8') # deve funcionar

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP