1
resposta

UTF-8 ocupa menos espaço que ISO-8859-1. em arquivos ASCII? Por que?

Li isso aqui em um site e não entendi:

"O arquivo em UTF-8 é maior que o em ISO-8859-1. Isso acontece porque o UTF-8 usa um esquema variável de bytes para representar cada caractere. Para os caracteres contidos na tabela ASCII, usa-se apenas 1 byte (127 bits somente); para caracteres diferentes, usa-se 2, 3, até 4 bytes para representá-los. Essa estrutura permite que o UTF-8 seja retrocompatível com antigos arquivos em ASCII, além de ocupar menos espaço quando o arquivo contém apenas os caracteres básicos da língua inglesa." Elo07

1 resposta

Olá, Lari! Tudo bem contigo?

Na verdade o UTF-8 ocupa mais espaço que o ISO-8859-1.

Veja nesse mesmo site onde pegou a informação ele diz

"Olhando na tabela de caracteres do ISO-8859-1 é possível ver que o byte e1 é o que representa o caractere á*. Um ponto muito importante a se notar é que o ISO-8859-1 é um encoding de *byte único, ou seja, cada caractere sempre ocupa 1 byte e, sendo assim, só consegue representar até 256 caracteres diferentes."

Sobre o UTF-8 o texto diz:

"Veja que interessante, o mesmo texto que antes conseguia ser representado em 3 bytes, agora está ocupando 4 bytes de espaço, e para piorar, os últimos bytes nem são iguais!"

E logo vem o texto que você postou, Lari!

Resumindo, quando acentuamos uma letra, o UTF-8 imprime um caractere especial (mostrado no exemplo do texto) dizendo que algo ali não foi encontrado. O ISO-8859-1 imprime dois :-(

Espero ter contribuído, Lari =D

Um abraço e bons estudos!