Кодовая таблица Windows-1251
К моменту появления первой версии Windows в России уже существовало несколько основных 8-битных кодировок для кириллицы, каждая со своими особенностями и сферой применения. Например:
С приходом графической оболочки Windows потребность в псевдографике отпала, зато возникла необходимость в типографских символах (тире «—», кавычки «» и т.д.), которых не было в существующих кодировках . Первые русификаторы для Windows создавались энтузиастами кустарно («самопальные»), и каждый разработчик использовал свою собственную таблицу символов, что создавало неразбериху .
В 1990-1991 годах было принято судьбоносное решение о создании единого стандарта. Над ним совместно работали представители трёх сторон :
- Фирма «Параграф» (разработчик программного обеспечения).
- Фирма «Диалог» (один из пионеров российского IT-рынка).
- Российское отделение корпорации Microsoft.
Первоначальный вариант кодировки сильно отличался от итогового и имел множество «белых пятен» (незанятых позиций), но он задал общее направление .
Начиная с версии Windows 3.1 и далее в Windows 95, кодировка Windows-1251 была включена в операционную систему в качестве стандартной кодовой страницы для кириллицы . Это обеспечило её тотальное доминирование:
- В течение 1990-х и 2000-х годов она стала основной кодировкой для всего русскоязычного сегмента интернета, электронной почты и текстовых документов .
- Даже в современных Unix-системах она известна под именем cp1251 .
Первая половина таблицы совпадает с таблицей ASCII.
Вторая половина таблицы представлена ниже:
| Dec | Hex | Char | Dec | Hex | Char | Dec | Hex | Char | Dec | Hex | Char |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 128 | 80 | Ђ | 160 | A0 | (NBSP) | 192 | C0 | А | 224 | E0 | а |
| 129 | 81 | Ѓ | 161 | A1 | Ў | 193 | C1 | Б | 225 | E1 | б |
| 130 | 82 | ‚ | 162 | A2 | ў | 194 | C2 | В | 226 | E2 | в |
| 131 | 83 | ѓ | 163 | A3 | Ј | 195 | C3 | Г | 227 | E3 | г |
| 132 | 84 | „ | 164 | A4 | ¤ | 196 | C4 | Д | 228 | E4 | д |
| 133 | 85 | … | 165 | A5 | Ґ | 197 | C5 | Е | 229 | E5 | е |
| 134 | 86 | † | 166 | A6 | ¦ | 198 | C6 | Ж | 230 | E6 | ж |
| 135 | 87 | ‡ | 167 | A7 | § | 199 | C7 | З | 231 | E7 | з |
| 136 | 88 | € | 168 | A8 | Ё | 200 | C8 | И | 232 | E8 | и |
| 137 | 89 | ‰ | 169 | A9 | © | 201 | C9 | Й | 233 | E9 | й |
| 138 | 8A | Љ | 170 | AA | Є | 202 | CA | К | 234 | EA | к |
| 139 | 8B | ‹ | 171 | AB | « | 203 | CB | Л | 235 | EB | л |
| 140 | 8C | Њ | 172 | AC | ¬ | 204 | CC | М | 236 | EC | м |
| 141 | 8D | Ќ | 173 | AD | 205 | CD | Н | 237 | ED | н | |
| 142 | 8E | Ћ | 174 | AE | ® | 206 | CE | О | 238 | EE | о |
| 143 | 8F | Џ | 175 | AF | Ї | 207 | CF | П | 239 | EF | п |
| 144 | 90 | ђ | 176 | B0 | ° | 208 | D0 | Р | 240 | F0 | р |
| 145 | 91 | ‘ | 177 | B1 | ± | 209 | D1 | С | 241 | F1 | с |
| 146 | 92 | ’ | 178 | B2 | І | 210 | D2 | Т | 242 | F2 | т |
| 147 | 93 | “ | 179 | B3 | і | 211 | D3 | У | 243 | F3 | у |
| 148 | 94 | ” | 180 | B4 | ґ | 212 | D4 | Ф | 244 | F4 | ф |
| 149 | 95 | • | 181 | B5 | µ | 213 | D5 | Х | 245 | F5 | х |
| 150 | 96 | – | 182 | B6 | ¶ | 214 | D6 | Ц | 246 | F6 | ц |
| 151 | 97 | — | 183 | B7 | · | 215 | D7 | Ч | 247 | F7 | ч |
| 152 | 98 | 184 | B8 | ё | 216 | D8 | Ш | 248 | F8 | ш | |
| 153 | 99 | ™ | 185 | B9 | № | 217 | D9 | Щ | 249 | F9 | щ |
| 154 | 9A | љ | 186 | BA | є | 218 | DA | Ъ | 250 | FA | ъ |
| 155 | 9B | › | 187 | BB | » | 219 | DB | Ы | 251 | FB | ы |
| 156 | 9C | њ | 188 | BC | ј | 220 | DC | Ь | 252 | FC | ь |
| 157 | 9D | ќ | 189 | BD | Ѕ | 221 | DD | Э | 253 | FD | э |
| 158 | 9E | ћ | 190 | BE | ѕ | 222 | DE | Ю | 254 | FE | ю |
| 159 | 9F | џ | 191 | BF | ї | 223 | DF | Я | 255 | FF | я |
Особенности Windows-1251
- Алфавитный порядок — русские буквы расположены строго по алфавиту (А-Я, а-я) без разрывов, в отличие от CP866 и KOI8-R .
- Ё и ё — находятся на 168 (Ё) и 184 (ё) позициях, отдельно от основного алфавита .
- Поддержка языков — полная поддержка:
- Белорусский (Ў, Ґ)
- Болгарский
- Македонски (Ѓ, Ќ, Џ)
- Сербский (Ђ, Ћ, Љ, Њ)
- Украинский (Є, І, Ї, Ґ)
- Типографика — в диапазоне 128–159 содержатся "умные" кавычки („ “ ”), длинное тире (—), знак евро (€), торговые марки (™) и другие символы, необходимые для качественной вёрстки .
Почему Windows-1251 стала самой популярной?
- Windows 3.1/95/98 — была стандартной кодировкой во всех русскоязычных версиях Windows, что обеспечило ей массовое распространение .
- Веб-сайты 90-х и 2000-х — подавляющее большинство сайтов Рунета использовали именно Windows-1251 до перехода на UTF-8 .
- Удобство для программистов — алфавитный порядок упрощал сортировку и обработку текста
- Единый стандарт для кириллицы — Windows-1251 использовалась в ставшей самой популярной операционной системой Windows, что делало её "народной" кодировкой.
Где использовалась
| Платформа/Система | Применение |
|---|---|
| Windows 3.x/9x/NT/2000/XP | Системная кодировка для русского языка |
| Internet Explorer | Кодировка по умолчанию для кириллических сайтов |
| Microsoft Office | Стандарт для русскоязычных документов |
| Веб-сайты | До 2010-х годов — основная кодировка Рунета |
| Электронная почта | Часто использовалась в письмах на русском |
Сейчас Windows-1251 постепенно вытесняется UTF-8, но до сих пор встречается в старых документах, базах данных и на некоторых веб-сайтах.