Размер текстового файла в разных системах кодирования определяется в зависимости от того, сколько байт отводится на один символ. 15
Например, в кодировке Unicode на каждый символ отводится 2 байта, а в UTF-8 — разное количество байт (английские буквы, цифры, знаки препинания — 1 байт, русские буквы — 2 байта, японские — 3 байта). 1
Чтобы определить объём текста в определённой кодировке, нужно посчитать количество символов с учётом пробелов и знаков препинания, а затем умножить на количество байт, используемых для кодирования этих символов. 2
Также для вычисления объёма текста можно воспользоваться онлайн-калькуляторами, например, на сайте allcalc.ru. 4