КОІ-8 (код обміну інформацією, 8 бітів; рос. КОИ-8) — восьмибітова ASCII-сумісна кодова таблиця, розроблена для кодування букв кириличних алфавітів.
Існує також семибітова версія кодування, не повністю сумісна з ASCII — КОІ-7. КОІ-7 і КОІ-8 описані в ГОСТ 19768-74 (зараз нечинний).
Ідея
Розробники КОІ-8 помістили символи російського алфавіту у верхній частині кодової таблиці таким чином, що позиції кириличних символів відповідають їхнім фонетичним аналогам в англійському алфавіті, в нижній частині таблиці. Це означає, що якщо в тексті, закодованому КОІ-8, прибрати восьмий біт кожного символу, то вийде прочитний текст, хоча й записаний латинськими символами. Наприклад, слова «Русский Текст» перетворяться на «rUSSKIJ tEKST». Як наслідок, символи кирилиці в таблиці виявилися розташованими не в алфавітному порядку.
Існує декілька варіантів кодування КОІ-8 для різних кириличних алфавітів. Російський алфавіт описується в кодуванні KOI8-R, український — у KOI8-U. KOI8-R став фактично стандартом для російської кирилиці в юнікс-подібних операційних системах і електронній пошті.
Андрій Чернов створив документ RFC 1489 («Registration of а Cyrillic Character Set»), який, проте, не належить до категорії RFC-стандартів. Існує RFC 2319 на KOI8-U.
RFC-2319. Стандарт кодування української мови сформований у RFC.
Створено ініціативною групою - Павло Гульчук, Юрко Демченко, Євген Шерстобітов, Борис Мостовий, Ігор Романенко, Олександр Єременко, Андрій Стесін.[1]
За набором символів KOI8-R відповідає одному з варіантів альтернативного кодування. Стандарт RFC 1489 також стверджує наявність графічних символів «рамок» (псевдографіки), проте ця вимога виконується досить рідко.
Нижня частина таблиці кодування (латиниця) повністю відповідає кодуванню ASCII.
Кодування KOI8-R (російське)
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
8−
|
─ 2500
|
│ 2502
|
┌ 250C
|
┐ 2510
|
└ 2514
|
┘ 2518
|
├ 251C
|
┤ 2524
|
┬ 252C
|
┴ 2534
|
┼ 253C
|
▀ 2580
|
▄ 2584
|
█ 2588
|
▌ 258C
|
▐ 2590
|
9−
|
░ 2591
|
▒ 2592
|
▓ 2593
|
⌠ 2320
|
■ 25A0
|
∙ 2219
|
√ 221A
|
≈ 2248
|
≤ 2264
|
≥ 2265
|
A0
|
⌡ 2321
|
° B0
|
² B2
|
· B7
|
÷ F7
|
A−
|
═ 2550
|
║ 2551
|
╒ 2552
|
ё 451
|
╓ 2553
|
╔ 2554
|
╕ 2555
|
╖ 2556
|
╗ 2557
|
╘ 2558
|
╙ 2559
|
╚ 255A
|
╛ 255B
|
╜ 255C
|
╝ 255D
|
╞ 255E
|
B−
|
╟ 255F
|
╠ 2560
|
╡ 2561
|
Ё 401
|
╢ 2562
|
╣ 2563
|
╤ 2564
|
╥ 2565
|
╦ 2566
|
╧ 2567
|
╨ 2568
|
╩ 2569
|
╪ 256A
|
╫ 256B
|
╬ 256C
|
© A9
|
C−
|
ю 44E
|
а 430
|
б 431
|
ц 446
|
д 434
|
е 435
|
ф 444
|
г 433
|
х 445
|
и 438
|
й 439
|
к 43A
|
л 43B
|
м 43C
|
н 43D
|
о 43E
|
D−
|
п 43F
|
я 44F
|
р 440
|
с 441
|
т 442
|
у 443
|
ж 436
|
в 432
|
ь 44C
|
ы 44B
|
з 437
|
ш 448
|
э 44D
|
щ 449
|
ч 447
|
ъ 44A
|
E−
|
Ю 42E
|
А 410
|
Б 411
|
Ц 426
|
Д 414
|
Е 415
|
Ф 424
|
Г 413
|
Х 425
|
И 418
|
Й 419
|
К 41A
|
Л 41B
|
М 41C
|
Н 41D
|
О 41E
|
F−
|
П 41F
|
Я 42F
|
Р 420
|
С 421
|
Т 422
|
У 423
|
Ж 416
|
В 412
|
Ь 42C
|
Ы 42B
|
З 417
|
Ш 428
|
Э 42D
|
Щ 429
|
Ч 427
|
Ъ 42A
|
Інші варіанти
показані лише неоднакові рядки таблиць, оскільки решта збігається
Кодування KOI8-U (українське)
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
A−
|
═ 2550
|
║ 2551
|
╒ 2552
|
ё 451
|
є 454
|
╔ 2554
|
і 456
|
ї 457
|
╗ 2557
|
╘ 2558
|
╙ 2559
|
╚ 255A
|
╛ 255B
|
ґ 491
|
╝ 255D
|
╞ 255E
|
B−
|
╟ 255F
|
╠ 2560
|
╡ 2561
|
Ё 401
|
Є 404
|
╣ 2563
|
І 406
|
Ї 407
|
╦ 2566
|
╧ 2567
|
╨ 2568
|
╩ 2569
|
╪ 256A
|
Ґ 490
|
╬ 256C
|
© A9
|
Кодування KOI8-RU (російсько-українсько-білоруське)
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
A−
|
═ 2550
|
║ 2551
|
╒ 2552
|
ё 451
|
є 454
|
╔ 2554
|
і 456
|
ї 457
|
╗ 2557
|
╘ 2558
|
╙ 2559
|
╚ 255A
|
╛ 255B
|
ґ 491
|
ў 45E
|
╞ 255E
|
B−
|
╟ 255F
|
╠ 2560
|
╡ 2561
|
Ё 401
|
Є 404
|
╣ 2563
|
І 406
|
Ї 407
|
╦ 2566
|
╧ 2567
|
╨ 2568
|
╩ 2569
|
╪ 256A
|
Ґ 490
|
Ў 40E
|
© A9
|
Кодування KOI8-C (кавказьке)
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
8.
|
ғ 493 |
җ 497
|
қ 49B |
ҝ 49D
|
ң 4A3 |
ү 4AF
|
ұ 4B1 |
ҳ 4B3
|
ҷ 4B7 |
ҹ 4B9
|
һ 4BB |
▀ 2580
|
ҝ 49D |
ӣ 4E3
|
ө 4E9 |
ӯ 4EF
|
9.
|
Ғ 492 |
Җ 496
|
Қ 49A |
Ҝ 49C
|
Ң 4A2 |
Ү 4AE
|
Ұ 4B0 |
Ҳ 4B2
|
Ҷ 4B6 |
Ҹ 4B8
|
Һ 4BA |
⌡ 2321
|
Ә 4D8 |
Ӣ 4E2
|
Ө 4E8 |
Ӯ 4EE
|
A.
|
A0 |
ђ 452
|
ѓ 453 |
ё 451
|
є 454 |
ѕ 455
|
і 456 |
ї 457
|
ј 458 |
љ 459
|
њ 45A |
ћ 45B
|
ќ 45C |
ґ 491
|
ў 45E |
џ 45F
|
B.
|
№ 2116 |
Ђ 402
|
Ѓ 403 |
Ё 401
|
Є 404 |
Ѕ 405
|
І 406 |
Ї 407
|
Ј 408 |
Љ 409
|
Њ 40A |
Ћ 40B
|
Ќ 40C |
Ґ 490
|
Ў 40E |
Џ 40F
|
Кодування KOI8-T (таджицьке)
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
8.
|
қ 49B |
ғ 493
|
‚ 201A |
Ғ 492
|
„ 201E |
… 2026
|
† 2020 |
‡ 2021
|
|
‰ 2030
|
ҳ 4B3 |
‹ 2039
|
Ҳ 4B2 |
ҷ 4B7
|
Ҷ 4B6 |
|
9.
|
Қ 49A |
‘ 2018
|
’ 2019 |
“ 201C
|
” 201D |
• 2022
|
– 2013 |
— 2014
|
|
™ 2122
|
|
› 203A
|
|
|
|
|
A.
|
|
ӯ 4EF
|
Ӯ 4EE |
ё 451
|
¤ A4 |
ӣ 4E3
|
¦ A6 |
§ A7
|
|
|
|
« AB
|
¬ AC |
AD
|
® AE |
|
B.
|
° B0 |
± B1
|
² B2 |
Ё 401
|
|
Ӣ 4E2
|
¶ B6 |
· B7
|
|
№ 2116
|
|
» BB
|
|
|
|
© A9
|
Кодування KOI8-O, KOI8-C (старослов'янська орфографія)
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
8−
|
Ђ 0402
|
Ѓ 0403
|
¸ 00B8
|
ѓ 0453
|
„ 201E
|
… 2026
|
† 2020
|
§ 00A7
|
€ 20AC
|
¨ 00A8
|
Љ 0409
|
‹ 2039
|
Њ 040A
|
Ќ 040C
|
Ћ 040B
|
Џ 040F
|
9−
|
ђ 0452
|
‘ 2018
|
’ 2019
|
“ 201C
|
” 201D
|
• 2022
|
– 2013
|
— 2014
|
£ 00A3
|
· 00B7
|
љ 0459
|
› 203A
|
њ 045A
|
ќ 045C
|
ћ 045B
|
џ 045F
|
A−
|
00A0
|
ѵ 0475
|
ѣ 0463
|
ё 0451
|
є 0454
|
ѕ 0455
|
і 0456
|
ї 0457
|
ј 0458
|
® 00AE
|
™ 2122
|
« 00AB
|
ѳ 0473
|
ґ 0491
|
ў 045E
|
´ 00B4
|
B−
|
° 00B0
|
Ѵ 0474
|
Ѣ 0462
|
Ё 0401
|
Є 0404
|
Ѕ 0405
|
І 0406
|
Ї 0407
|
Ј 0408
|
№ 2116
|
¢ 00A2
|
» 00BB
|
Ѳ 0472
|
Ґ 0490
|
Ў 040E
|
© 00A9
|
Кодування ISO-IR-111, koi8-e
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
A−
|
00A0
|
ђ 0452
|
ѓ 0453
|
ё 0451
|
є 0454
|
ѕ 0455
|
і 0456
|
ї 0457
|
ј 0458
|
љ 0459
|
њ 045A
|
ћ 045B
|
ќ 045C
|
00AD
|
ў 045E
|
џ 045F
|
B−
|
№ 2116
|
Ђ 0402
|
Ѓ 0403
|
Ё 0401
|
Є 0404
|
Ѕ 0405
|
І 0406
|
Ї 0407
|
Ј 0408
|
Љ 0409
|
Њ 040A
|
Ћ 040B
|
Ќ 040C
|
¤ 00A4
|
Ў 040E
|
Џ 040F
|
Кодування KOI8-Unified, koi8-f
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
8−
|
─ 2500
|
│ 2502
|
┌ 250C
|
┐ 2510
|
└ 2514
|
┘ 2518
|
├ 251C
|
┤ 2524
|
┬ 252C
|
┴ 2534
|
┼ 253C
|
▀ 2580
|
▄ 2584
|
█ 2588
|
▌ 258C
|
▐ 2590
|
9−
|
░ 2591
|
‘ 2018
|
’ 2019
|
“ 201C
|
” 201D
|
• 2022
|
– 2013
|
— 2014
|
© 00A9
|
™ 2122
|
00A0
|
» 00BB
|
® 00AE
|
« 00AB
|
· 00B7
|
¤ 00A4
|
A−
|
00A0
|
ђ 0452
|
ѓ 0453
|
ё 0451
|
є 0454
|
ѕ 0455
|
і 0456
|
ї 0457
|
ј 0458
|
љ 0459
|
њ 045A
|
ћ 045B
|
ќ 045C
|
ґ 0491
|
ў 045E
|
џ 045F
|
B−
|
№ 2116
|
Ђ 0402
|
Ѓ 0403
|
Ё 0401
|
Є 0404
|
Ѕ 0405
|
І 0406
|
Ї 0407
|
Ј 0408
|
Љ 0409
|
Њ 040A
|
Ћ 040B
|
Ќ 040C
|
Ґ 0490
|
Ў 040E
|
Џ 040F
|
Некириличні варіанти KOI-8
В деяких країнах РЕВ були створені модифікації КОІ-8 для національних варіантів латиниці. Базова ідея була та ж сама : при «зрізанні» восьмого біта текст мав лишатися більш-менш зрозумілим. Наприклад, в чеському варіанті КОІ-8 букви Čč повинні перетворюватися на cC, Žž — на zZ тощо. В наш час[коли?] ці кодування не використовуються.
Див. також
Примітки
Посилання