Некоторые языки программирования занимают разное количество байт в текстовых форматах из-за различий в используемых кодировках символов. 24
Например, в кодировке UTF-8 разные символы кодируются разным количеством байтов. 4 Те, что входят в старый ASCII, кодируются одним байтом, русские и западноевропейские символы — двумя, японские катакана и хирагана — тремя, а есть и такие, для которых может потребоваться и четыре байта. 4
В кодировке UTF-16 для кодирования одного символа используются двухбайтовые целые. 4 Этого хватает для хранения большинства распространённых на практике символов. 4 Для редких символов, включённых в Юникод позднее, используются пары двухбайтовых целых. 4
В кодировке UTF-32 (или, что почти одно и то же — UCS-4) для представления символа используется строго 4 байта. 4 С недавнего времени Python на большинстве платформ использует именно четырёхбайтовое представление для юникодных строк. 4