12 Апр 2026, Вс

7 класс. Кодирование текстов. Равномерные и неравномерные коды

(Задание №6 ВПР 2025)

Текстовые редакторы

  • Блокнот (notepad) в Windows
  • Mousepad в Linux

Если мы наберем слово Informatics в этих текстовых редакторах и сохраним его в файле, то обнаружим, что объём файла равен 11 байтам.

Догадываетесь, почему?

Для тех, кто не догадался - ответ: потому что в слове Informatics 11 букв.

В полученном файле каждая буква занимает 1 байт или 8 бит.

Но буква может занимать и другое количество бит. Это зависит от способа кодирования.

Вот пример кодовой таблицы, в которой каждый символ занимает 8 бит:

СимволДвоичный кодСимволДвоичный кодСимволДвоичный кодСимволДвоичный код
NUL00000000Space00100000@01000000`01100000
SOH00000001!00100001A01000001a01100001
STX00000010"00100010B01000010b01100010
ETX00000011#00100011C01000011c01100011
EOT00000100$00100100D01000100d01100100
ENQ00000101%00100101E01000101e01100101
ACK00000110&00100110F01000110f01100110
BEL00000111'00100111G01000111g01100111
BS00001000(00101000H01001000h01101000
HT00001001)00101001I01001001i01101001
LF00001010*00101010J01001010j01101010
VT00001011+00101011K01001011k01101011
FF00001100,00101100L01001100l01101100
CR00001101-00101101M01001101m01101101
SO00001110.00101110N01001110n01101110
SI00001111/00101111O01001111o01101111
DLE00010000000110000P01010000p01110000
DC100010001100110001Q01010001q01110001
DC200010010200110010R01010010r01110010
DC300010011300110011S01010011s01110011
DC400010100400110100T01010100t01110100
NAK00010101500110101U01010101u01110101
SYN00010110600110110V01010110v01110110
ETB00010111700110111W01010111w01110111
CAN00011000800111000X01011000x01111000
EM00011001900111001Y01011001y01111001
SUB00011010:00111010Z01011010z01111010
ESC00011011;00111011[01011011{01111011
FS00011100<00111100\01011100|01111100
GS00011101=00111101]01011101}01111101
RS00011110>00111110^01011110~01111110
US00011111?00111111_01011111DEL01111111

Но если нам не нужно столько символов, сколько в этой кодовой таблице, можно обойтись меньшим количеством бит на каждый символ.

Если нужно только две буквы - достаточно одного бита:
А - 0
Б - 1

Если нужно 4 буквы - достаточно двух бит:

А - 00
Б - 01
В - 10
Г - 11

А чтобы узнать, сколько бит нужно для кодирования N букв, можно воспользоваться формулой

2i=N (два в степени i равно N)

В этой формуле N - это количество символов, а i - информационный вес символа, или количество бит информации, который он несет в себе.



Мы используем cookie-файлы для наилучшего представления нашего сайта. Продолжая использовать этот сайт, вы соглашаетесь с использованием cookie-файлов.
Принять