Кодирование текстовой информации — это процесс её преобразования из формы, удобной для использования, в форму, удобную для передачи, хранения, автоматической переработки и сохранения от несанкционированного доступа. 2
В компьютерах кодирование текстовой информации осуществляется при помощи двоичного кода. 1 Каждый символ получает определённое неотрицательное значение (число) или специальный код, который записывается в память оборудования. 1
Соотношение между символами и знаками их кодировки носит название системы кодировки. 1 Некоторые примеры:
- ASCII. 1 Для «шифрования» одного символа используются 7 бит. 1 С их помощью можно закодировать до 128 символов. 1
- UNICODE. 1 Здесь каждый символ получает 2 байта. 1 В конечном итоге можно рассчитывать на 62 536 различных кодировок. 1
При сохранении текстовой информации в разных форматах могут быть свои особенности кодирования, например:
- Формат *.txt. 5 Самый «экономный» из текстовых форматов. 5 Сохраняются только коды символов в выбранной таблице кодировки. 5
- Формат *.doc. 5 Основной для текстового процессора Microsoft Word. 5 При сохранении документа в этом формате кроме кодов символов, составляющих текст, записываются ещё коды параметров страницы, выбранного шрифта, способа оформления и т. п.. 5
- Формат *.rtf. 5 Разработан специально для того, чтобы текстовый файл, созданный в одном редакторе, можно было прочитать в другом текстовом редакторе. 5