2
respostas

Não ficou claro a vantagem do UTF-8

Na explicação do professor ele disse que para mudarmos, por exemplo, do padrão Latin1, que gasta em média 1byte para representar seus caracteres, para o padrão UNICODE, que gasta em média 3bytes; gastaríamos mais dois bytes no Latin1 para ele fazer, mais ou menos, o mesmo que ele já faz.

Já para o UTF-8, por exemplo, um caractere especial como o rosto feliz pode ser representado por 4bytes.

Minha dúvida:

Se mudamos do padrão Latin1 para o padrão UTF-8 não estaríamos gastando ainda mais espaço para representar um caractere do que gastaríamos mudando para o padrão UNICODE?

Farei uma breve pesquisa para me esclarecer e postarei os resultados aqui, se alguém, antes disso, conseguir me explicar seria excelente.

Bons estudos pra todos!

Um abraço...!

2 respostas

Na realidade a vantagem do UTF-8 é que a quantidade de bytes pode variar de 1 byte para representar algo da tabela ASCII a 4 bytes dependendo do caractere Unicode, lembrando que UTF-8 é um esquema de codificação que implementa o Unicode que é um padrão, por exemplo além do UTF-8, você tem UTF-16, UTF-32.

https://www.ime.usp.br/~pf/algoritmos/apend/unicode.html

O UTF-8 começará a usar 3 ou mais bytes para os caracteres de ordem superior, onde o UTF-16 permanece em apenas 2 bytes para a maioria dos caracteres. UTF-32 cobrirá todos os caracteres possíveis em 4 bytes.