Система кодировки символов в текстовых документах работает следующим образом: 1
Общая идея кодировки текста заключается в использовании стандартных кодовых таблиц и шрифтов для установления соответствия между кодом и изображением символа. 4
Например, в кодировке ASCII каждый символ закодирован 8 битами, первые 7 из которых (128 символов) отведены под символы латинского алфавита, управляющие символы (переносы строк, табуляция и т. д.) и грамматические символы, а остальные — под национальные языки. 2
Также существует стандарт Unicode, который позволяет использовать в одном документе любые языки и символы. 3 В этой кодировке один символ может быть закодирован разным количеством структурных единиц кодировки, то есть разным количеством байтов: например, латиница кодируется одним байтом, а кириллица — двумя байтами. 2