Принцип работы современных кодировок текста заключается в присвоении каждому символу уникального десятичного кода или соответствующего ему двоичного кода. multiurok.ru Этот код — порядковый номер символа в двоичной системе счисления. multiurok.ru
Человек различает символы по их начертанию, а компьютер — по их коду. multiurok.ru Внешний вид символов определяется файлами шрифтов, которые установлены на компьютере. intuit.ru
Некоторые современные кодировки и их особенности:
- Unicode. www.ihc.ru Основной стандарт кодировки символов, который используется во всех случаях, где есть текст. www.ihc.ru Таблица Unicode содержит большой объём данных, поэтому в компьютерной памяти хранятся не символы, а табличные номера. www.ihc.ru
- UTF-8. javarush.com Кодировка переменной длины, в которой каждый символ текста может быть закодирован в последовательность длиной от одного до шести байт. javarush.com На практике используется диапазон от одного до четырёх байт. javarush.com
- ASCII. multiurok.ru intuit.ru Международная стандартная кодировочная таблица для печатных символов и некоторых специальных кодов. intuit.ru Стандартизирована только половина таблицы, первые 128 символов, которые включают в себя буквы латинского алфавита. intuit.ru Вторая половина таблицы отдана под национальные символы, и в каждой стране эта часть различна. intuit.ru