Громадянам України

Що таке набір стандартів Unicode?

Стандарт Unicode є специфікація схеми кодування для письмових символів і тексту. Це універсальний стандарт, який забезпечує послідовне кодування багатомовного тексту та дозволяє безконфліктно обмінюватися текстовими даними на міжнародному рівні.

Стандарт кодування символів Unicode є схема кодування символів фіксованої довжини, яка включає символи майже всіх живих мов світу. Інформацію про Unicode можна знайти в The Unicode Standard і на веб-сайті Unicode Consortium за адресою www.unicode.org.

Сам стандарт Unicode визначає три кодування: UTF-8, UTF-16 і UTF-32, хоча існує кілька інших. З них UTF-8 є найпоширенішим із великим відривом, частково завдяки його зворотній сумісності з ASCII.

Unicode 15.1 Основна функція Unicode, заснована в 1988 році, полягає в підтримці та оновленні стандарту Unicode, стандарту кодування тексту, призначеного для підтримки всіх символів усіх систем письма світу. Станом на Юнікод 15.1 опублікований у вересні 2023 року, стандарт визначає 149 813 символів у 161 сценарії.');})();(function(){window.jsl.dh('KNe4ZszEAfq1wN4Psebm6AQ__48','

Наприклад, U+0041 присвоєно ім’я символу «ВЕЛИКА ЛАТИНСЬКА ЛІТЕРА A». U+0A1B призначається ім’я персонажа «ГУРМУКХІ ЛІТЕРА ЧА». Ці імена Unicode ідентичні назвам ISO/IEC 10646 для тих самих символів. Стандарт Unicode групує символи разом за сценаріями в блоки.

Юнікод підтримує більше мільйона кодових точок, які записуються буквою «U», за якою йде знак «плюс» і число в шістнадцятковому форматі; наприклад, слово "Привіт" пишеться U+0048 U+0065 U+006C U+006C U+006F (див. шістнадцяткову діаграму).