Форматы кодирования символов в разных текстовых редакторах могут отличаться используемыми стандартами. otus.ru Они могут отличаться в зависимости от языка или операционной системы. otus.ru
Некоторые популярные стандарты кодирования:
- ASCII. otus.ru Стандарт, который поддерживает английский алфавит (латиницу). otus.ru Включает в себя 128 уникальных символов, которые разделяются на управляющие компоненты и печатные. otus.ru
- ISO. otus.ru Это кодировка, которая представлена совокупностью 8-битных кодировок. otus.ru В ней младшая половина — это ASCII, а старшая отвечает за символьное определение различных языков. otus.ru
- CP866. otus.ru Альтернативная кодировка от IBM, в которой все специфические европейские элементы в верхней части таблицы заменены на кириллицу. otus.ru
- Unicode. sky.pro otus.ru Универсальная система кодирования, которая может представлять символы практически из всех известных человечеству систем письма. sky.pro В Unicode каждому символу присваивается уникальный номер, известный как кодовая точка. sky.pro
Например, в кодировке UTF-8 латиница кодируется одним байтом, а кириллица — двумя байтами. habr.com