8-битный ASCII не используется для работы с современными международными текстами, потому что его ограничений недостаточно для кодирования символов многих языков. 45
ASCII содержит всего 128 кодовых точек, из которых только 95 являются печатными символами. 1 Этого количества не хватает, например, для языков, в которых есть специфические символы, или для работы с кириллицей. 2
Кроме того, создание 8-разрядных таблиц кодировки стало неконтролируемым: каждый новый компьютерный шрифт вводил собственную таблицу. 5
Для решения этих проблем была разработана единая система кодирования — Unicode, которая присвоила уникальные числовые коды каждому символу любого языка мира. 3 Это позволило избежать путаницы при передаче информации между различными платформами и программами. 3
Наиболее популярным форматом Unicode стал UTF-8, который использует переменную длину кодирования: для символов ASCII требуется всего один байт, а для представления более редких символов может использоваться до четырёх байт. 3