O código oficial da Internet Assigned Numbers Authority (IANA) para a codificação é "UTF-8"
[1] É convencionado que todas as letras são maiúsculas e o nome é hifenizado. Essa ortografia é usual em todos os documentos do Unicode Consortium relacionados à codificação.
No entanto, o nome "utf-8" pode ser usado por todos os padrões em conformidade com a lista IANA (que incluem cabeçalhos CSS, HTML, XML e HTTP), pois a declaração não diferencia maiúsculas de minúsculas. [2]
UTF-8 codifica pontos de código em um a quatro bytes, dependendo do valor do ponto de código. Na tabela a seguir, os caracteres x são substituídos pelos bits do ponto de código (ver figura).
O World Wide Web Consortium recomenda UTF-8 como a codificação padrão em XML e HTML (e não apenas usando UTF-8, também declarando-o em metadados), "mesmo quando todos os caracteres estão no intervalo ASCII ... O uso de codificações não-UTF-8 pode ter resultados inesperados". [3]
Muitos softwares suportam UTF-8, tais como: Microsoft Word[4][5][6], o Microsoft Excel (2016 e posterior), Google Drive e o LibreOffice.
Fontes:
Tabela:
a) 17 planes times 216 code points per plane, minus 211 technically-invalid surrogates.
b) There are enough x bits to encode up to 0x1FFFFF, but the current RFC 3629 §3 limits UTF-8 encoding to code point U+10FFFF, to match the limits of UTF-16. The obsolete RFC 2279 allowed UTF-8 encoding up to (then legal) code point U+7FFFFFF.
Texto:
- "Character Sets". Internet Assigned Numbers Authority. 2013-01-23. Retrieved 2013-02-08.
- Dürst, Martin. "Setting the HTTP charset parameter". W3C. Retrieved 2013-02-08.
- "utf 8 - Character encoding of Microsoft Word DOC and DOCX files?". Stack Overflow. Retrieved 2021-11-01.
- "Exporting a UTF-8 .txt file from Word".
- "excel - Are XLSX files UTF-8 encoded by definition?". Stack Overflow. Retrieved 2021-11-01.
- "How to open UTF-8 CSV file in Excel without mis-conversion of characters in Japanese and Chinese language for both Mac and Windows?". answers.microsoft.com. Retrieved 2021-11-01.