2
respostas

A importância do UTF-8

O código oficial da Internet Assigned Numbers Authority (IANA) para a codificação é "UTF-8"

[1] É convencionado que todas as letras são maiúsculas e o nome é hifenizado. Essa ortografia é usual em todos os documentos do Unicode Consortium relacionados à codificação.

No entanto, o nome "utf-8" pode ser usado por todos os padrões em conformidade com a lista IANA (que incluem cabeçalhos CSS, HTML, XML e HTTP), pois a declaração não diferencia maiúsculas de minúsculas. [2]

Insira aqui a descrição dessa imagem para ajudar na acessibilidadeUTF-8 codifica pontos de código em um a quatro bytes, dependendo do valor do ponto de código. Na tabela a seguir, os caracteres x são substituídos pelos bits do ponto de código (ver figura).

O World Wide Web Consortium recomenda UTF-8 como a codificação padrão em XML e HTML (e não apenas usando UTF-8, também declarando-o em metadados), "mesmo quando todos os caracteres estão no intervalo ASCII ... O uso de codificações não-UTF-8 pode ter resultados inesperados". [3]

Muitos softwares suportam UTF-8, tais como: Microsoft Word[4][5][6], o Microsoft Excel (2016 e posterior), Google Drive e o LibreOffice.

Fontes:

Tabela:

a) 17 planes times 216 code points per plane, minus 211 technically-invalid surrogates.

b) There are enough x bits to encode up to 0x1FFFFF, but the current RFC 3629 §3 limits UTF-8 encoding to code point U+10FFFF, to match the limits of UTF-16. The obsolete RFC 2279 allowed UTF-8 encoding up to (then legal) code point U+7FFFFFF.

Texto:

  1. "Character Sets". Internet Assigned Numbers Authority. 2013-01-23. Retrieved 2013-02-08.
  2. Dürst, Martin. "Setting the HTTP charset parameter". W3C. Retrieved 2013-02-08.
  3. "utf 8 - Character encoding of Microsoft Word DOC and DOCX files?". Stack Overflow. Retrieved 2021-11-01.
  4. "Exporting a UTF-8 .txt file from Word".
  5. "excel - Are XLSX files UTF-8 encoded by definition?". Stack Overflow. Retrieved 2021-11-01.
  6. "How to open UTF-8 CSV file in Excel without mis-conversion of characters in Japanese and Chinese language for both Mac and Windows?". answers.microsoft.com. Retrieved 2021-11-01.
2 respostas

Opa André, tudo ok por aí ?

Eu agradeço por você compartilhar todos esse pontos que você aprendeu sobre o funcionamento da propriedade “UFT-8”, eles de fato são verídicos e as fontes também são confiáveis.

Então fico imensamente agradecido por você ter o trabalho e a dedicação de abrir esse tópico no fórum para compartilhar todo esse conhecimento valioso com os outros alunos.

E somente para reforçar o que já foi dito por você, de acordo com as boas maneiras de escrita de código na programação o mais recomendado e mais usado pela comunidade é escrever essa propriedade em maiúsculo. Inclusive alguns editores de código que oferecem a estrutura básica de um documento HTML configuram essa propriedade já em maiúsculo, mas como já foi bem pontuado em seu tópico, é possível sim fazer o uso dela em minúsculo e vai funcionar, mas não é o mais recomendado!

Também aproveito para ressaltar que caso tenha dúvidas relacionadas ao conteúdo do curso recorra ao fórum!

Um abraço.

Renan, positivo. UTF-8 sempre em maiúsculo (upper-case). :) Obrigado!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software