Некоторые символы в Unicode занимают больше места, чем в ASCII, потому что один символ кодируется не одним байтом, а последовательностью байтов. 1
Например, в кодировке UTF-8 наиболее распространённые символы занимают 1–2 байта, а редко встречающиеся могут использовать 4 байта. 2 В то время как все символы таблицы ASCII занимают ровно по одному байту. 2