Thai Industrial Standard 620-2533 (タイ工業規格、通称TIS-620) はタイ語でもっともよく使われる文字集合および文字符号化方式である。この規格はタイ王国政府工業省の機関タイ工業規格協会 (Thai Industrial Standards Institute; TISI) によって発行され、タイ王国においてタイ語を符号化するための唯一の公的規格である。規格の記述的な名称は "Standard for Thai Character Codes for Computers" (タイ語: รหัสสำหรับอักขระไทยที่ใช้กับคอมพิวเตอร์) である。"2533" は現在の規格が発行されたタイ暦2533年 (1990年) を指す。以前の版である TIS 620-2529 (1986年) は、廃止された。
構造
TIS-620(มอก.620-2533)は7ビットASCIIとの完全な互換性を保ち、8ビットの範囲の16進数A1からFBまでをタイ文字の符号化に使うという、拡張ASCIIの伝統的な構造を持つ。タイ語母音とダイアクリティカルマークの複雑に結合する性質のため、TIS-620は情報交換のみを意図しており、文字を正しく合成するには追加の表示エンジンが必要であることに注意。
変種
TIS-620とほとんど同じバージョンがISO/IEC 8859-11として1999年に採用された。唯一の違いは、ISO 8859-11が16進数A0をノーブレークスペースと定義しているのに対して、TIS-620は未定義のまま予約している点である (現実には、この小さな違いは無視されるのが普通である)。
ISO 8859-11集合はEcma InternationalによってISO-IR-166としても登録された。しかしこの変種はタイ文字シーケンスの開始と終了を知らせるために明示的なエスケープコードを追加している。
TIS-620文字集合の順序は本質的にUnicode (ISO/IEC 10646) にあるものと同じである。Unicodeのタイ語領域はU+0E01からU+0E7Fであり、TIS-620のタイ文字は単純に各バイトに0Eを付加してその値からA0を引くことで、UTF-16に変換できる。
TIS-620
|
x0 |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 |
x9 |
xA |
xB |
xC |
xD |
xE |
xF
|
0x
|
未使用
|
1x
|
2x
|
SP |
! |
" |
# |
$ |
% |
& |
' |
( |
) |
* |
+ |
, |
- |
. |
/
|
3x
|
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
: |
; |
< |
= |
> |
?
|
4x
|
@ |
A |
B |
C |
D |
E |
F |
G |
H |
I |
J |
K |
L |
M |
N |
O
|
5x
|
P |
Q |
R |
S |
T |
U |
V |
W |
X |
Y |
Z |
[ |
\ |
] |
^ |
_
|
6x
|
` |
a |
b |
c |
d |
e |
f |
g |
h |
i |
j |
k |
l |
m |
n |
o
|
7x
|
p |
q |
r |
s |
t |
u |
v |
w |
x |
y |
z |
{ |
| |
} |
~
|
|
8x
|
未使用
|
9x
|
Ax
|
|
ก |
ข |
ฃ |
ค |
ฅ |
ฆ |
ง |
จ |
ฉ |
ช |
ซ |
ฌ |
ญ |
ฎ |
ฏ
|
Bx
|
ฐ |
ฑ |
ฒ |
ณ |
ด |
ต |
ถ |
ท |
ธ |
น |
บ |
ป |
ผ |
ฝ |
พ |
ฟ
|
Cx
|
ภ |
ม |
ย |
ร |
ฤ |
ล |
ฦ |
ว |
ศ |
ษ |
ส |
ห |
ฬ |
อ |
ฮ |
ฯ
|
Dx
|
ะ
|
◌ั |
า |
ำ
|
◌ิ
|
◌ี
|
◌ึ
|
◌ื
|
◌ุ
|
◌ู
|
◌ฺ
|
|
|
|
|
฿
|
Ex
|
เ |
แ |
โ |
ใ |
ไ |
ๅ |
ๆ
|
◌็
|
◌่
|
◌้
|
◌๊
|
◌๋
|
◌์
|
◌ํ
|
◌๎
|
๏
|
Fx
|
๐ |
๑ |
๒ |
๓ |
๔ |
๕ |
๖ |
๗ |
๘ |
๙ |
๚ |
๛
|
|
|
|
|
すべての文字を見るには文字サイズをおよそ200%に設定する必要があるかもしれない
上記の表では、20は通常のSPACE文字である。符号値 00-1F, 7F, 80-9F, A0, DB-DE および FC-FF には、TIS-620では文字が割り当てられていない。
符号値 D1, D4-DA, E7-EE は結合文字である。
外部リンク