Вопросы к Поиску с Алисой
Объём данных при переходе от ASCII к Unicode мог изменяться в зависимости от версии Unicode. otus.ru
UTF-32: в этой первой реализации Unicode для шифрования одного символа или знака использовали 32 бита, что составляло 4 байта информации. otus.ru Из-за такого подхода при переводе документа из ASCII в Unicode его вес увеличивался в 4 раза. otus.ru
UTF-16: в этой версии Unicode для шифрования одного символа применяли 2 байта или 16 бит. otus.ru easyinformatics.ru UTF-16 уменьшил размер исходного документа при преобразовании с ASCII в 2 раза. otus.ru
UTF-8: в этой форме Unicode юникодные символы кодируются одиночными байтами. softwaremaniacs.org Те, которые входят в старый ASCII, кодируются одним байтом, а другие символы кодируются разным количеством байтов: русские и западноевропейские символы — двумя байтами, японские катакана и хирагана — тремя, а есть и такие, для которых могут потребоваться и четыре байта. softwaremaniacs.org В большинстве текстов, которые традиционно состоят в основном из ASCII, UTF-8 не занимает сильно больше места, чем ASCII — тот же байт на символ. softwaremaniacs.org