При кодировании текста Unicode данные в оперативной памяти хранятся в виде двоичного числа. 3 Когда символ сохраняется в памяти, он сначала преобразуется в цифровой код, а затем этот код сохраняется как двоичное число. 3
То, как символы с соответствующими кодами будут храниться в памяти компьютера, зависит от конкретной кодировки, базирующейся на Unicode, например UTF-8. 3
В UTF-8 каждый символ кодируется разным количеством байтов — всё зависит от того, какой длины исходное число: 4
Например, латинские буквы и цифры в UTF-8 закодированы под один байт, а китайские иероглифы — под два байта. 1