1
resposta

Para saber mais: tabela Unicode

A tabela Unicode é a tabela que é usada pelo Phyton para ele poder se adequar a língua falada no pais, com isso ele permite que caracteres que não possuem como alfabeto inglês possam ser visíveis e no idioma onde está será executado o programa.

1 resposta

Olá, Marcelo. Como vai?

Sua definição foi excelente! O Unicode é exatamente o herói dos bastidores que permite que o Python (e praticamente todos os sistemas operacionais e softwares modernos do mundo) consiga entender e exibir caracteres de qualquer idioma da Terra.

Antes do Unicode existir, o mundo da computação utilizava tabelas mais antigas e limitadas, como a tabela ASCII. O grande problema da ASCII era que ela só conseguia armazenar 128 caracteres, cobrindo basicamente o alfabeto da língua inglesa, números e alguns símbolos básicos.

Quando desenvolvedores de países como o Brasil precisavam usar acentos (á, ç, õ), ou países orientais precisavam exibir seus alfabetos (como o japonês ou chinês), os computadores antigos se confundiam e exibiam aqueles caracteres quebrados estranhos (como é no lugar de é).

O Unicode resolveu isso de forma definitiva ao criar um padrão global. Veja como ele funciona na prática por trás dos panos:

  • Um número para cada caractere: O Unicode funciona como um dicionário universal gigante. Ele atribui um código único (chamado de Code Point) para cada letra, acento ou caractere do planeta. Por exemplo, a nossa letra ç tem o código único U+00E7.
  • Além dos idiomas, os Emojis: Uma curiosidade fantástica é que os próprios emojis que usamos nos celulares hoje em dia, só funcionam em qualquer lugar porque o consórcio Unicode também deu um número de identificação único para cada um deles!

No Python, você pode até visualizar esse comportamento usando a função nativa ord(), que revela o número Unicode de qualquer caractere. Se você testar esse código no seu Google Colab, verá a mágica acontecer:

# Descobrindo o número Unicode da nossa letra 'ç'
codigo_cedilha = ord('ç')
print("O código Unicode do 'ç' é:", codigo_cedilha)

# O resultado exibido na tela será o número: 231

Graças a essa compatibilidade nativa do Python com o Unicode, você pode manipular textos em português contendo acentuação, nomes próprios e símbolos monetários sem se preocupar com problemas de compatibilidade ou textos quebrando na tela do usuário.

Parabéns por pesquisar mais a fundo sobre esse tema! Entender como o computador interpreta textos é um diferencial enorme na formação de um profissional de dados.

Espero que possa ter lhe ajudado!