Кодировка ASCII описывает первые 128 символов из наиболее часто используемых англоязычными пользователями — латинские буквы, арабские цифры и знаки препинания. 2 Ещё в эти 128 знаков, описанных в ASCII, попадали некоторые служебные символы вроде скобок, решёток, звёздочек и т.п.. 2
Кодировка UTF-8 имеет переменную длину, то есть каждый символ текста может быть закодирован в последовательность длиной от одного до шести байт. 2 На практике же в UTF-8 используется только диапазон от одного до четырёх байт. 2 Все латинские знаки в ней кодируются в один байт, так же как и в ASCII. 2 Кириллические же знаки в UTF-8 кодируются в два байта, а, например, грузинские — в три байта. 2
Таким образом, основное отличие в том, что ASCII описывает ограниченный набор символов, в то время как UTF-8 универсальна и позволяет представлять любые символы из любой языковой системы. 1