Некоторые отличия Unicode от классической кодировки MS-DOS:
- Размер кода символа: в кодировке MS-DOS код символа хранится в одном байте, поэтому символы могут принимать значения от 0 до 255. 1 В Unicode символ кодируется двумя байтами, поэтому коды символов могут принимать значения от 0 до 65535. 1
- Набор символов: в кодировке MS-DOS среди дополнительных символов есть элементы рамок, которые облегчали рисование таблиц в различных текстовых редакторах. 2 В Unicode имеются коды для всех букв алфавитов множества языков, математических, декоративных символов и т. д.. 1
- Стандартизация символов: первые 128 символов стандартизированы и одинаковы во всех кодировках по всему миру. 23 Они состоят из английского алфавита, цифр и основных знаков. 23 Оставшиеся 128 позиций отданы национальным алфавитам и дополнительным символам. 23 В кодировке MS-DOS эти позиции соответствуют национальным алфавитам, которые отличаются для разных стран. 1 В Unicode в одном наборе знаков можно представить почти все языки мира. 2
Таким образом, Unicode более универсален и позволяет работать с большим количеством символов, чем кодировка MS-DOS.