Вопросы к Поиску с Алисой
При переходе от ASCII к Unicode размер текстовых файлов мог увеличиваться или уменьшаться в зависимости от используемой версии Unicode. otus.ru javarush.com
UTF-32. otus.ru javarush.com Для шифрования одной буквы в этой версии Unicode требуется 4 байта. otus.ru В результате при переводе документа из ASCII в Unicode его вес увеличивался в 4 раза. otus.ru
UTF-16. otus.ru javarush.com Для шифрования одного символа используется 2 байта или 16 бит. otus.ru При преобразовании из ASCII размер исходного документа уменьшался в 2 раза. otus.ru
UTF-8. otus.ru javarush.com Кодировка имеет переменную длину: каждый символ может быть закодирован последовательностью от 1 до 6 байт. javarush.com Чаще всего стандарт требует до 4 байт для шифрования одного элемента текста. otus.ru Если в дешифрованном документе много пространства занимают знаки препинания, пробел и латинские буквы, UTF-8 выигрывает по объёму по сравнению с UTF-16. otus.ru