MacJapanese またはMac OS Japanese は、Apple がShift_JIS を独自に拡張した文字コード である。
主にClassic Mac OS のバージョン 7.1からバージョン 9.x までの間で利用された。
対応する文字コード
MacJapaneseはIANA によって登録されていない。そのためRFC 2045 の§ 6.3 に従って、XML 、MIME などでは "x-Mac-Japanese " という文字列 がこの文字コードの名前として使われている(Apple製であるiPod もこの名前を認識する[ 1] )。
また、MacJapaneseをUnicode にマッピング(対応付け)した上で、Unicode用の文字符号化方式 (UTF-16 、UTF-8 など)を使って符号化する方法もあり、macOS のファイル名などにはこの方法が使われている。ただし、MacJapanese固有の文字を私用領域 (Private Use Area) のU+F860、U+F861、U+F862、U+F87A、U+F87E、U+F87Fを使って表現するので、macOS以外の環境との互換性は無い。
歴史
文字セット
以下、「0x」を数字の先頭に付けた十六進法 表記を用いて各文字のコードを表す。
1バイト
0x00から0x7Fまでと0xA1から0xDFまでの部分(いわゆる半角 文字の部分)はJIS X 0201 に準ずる。ただし0x7EにはASCII に倣ってU+7Eのチルダ が割り当てられている。
次の記号が追加されている。
0x80 …… U+5C reverse solidus (= backslash)、半角バックスラッシュ 「\ 」(ASCII の0x5Cと同じ)
0xA0 …… U+A0 no-break space、ノーブレークスペース (NBSP)
0xFD …… U+A9 copyright sign、著作権記号 「© 」(○で囲まれた「C」)
0xFE …… U+2122 trade mark sign、商標記号「™ 」(「TM 」)
0xFF …… halfwidth horizontal ellipsis、半角の欧文用三点リーダー (半角幅の「... 」)
2バイト
2バイトで表される文字(いわゆる全角 文字)は、JIS X 0208 -1990 を基にしている。さらに0x8540から0x886Dに「Apple標準システム外字」(記号など)が、0xEB41から0xED96までに縦書き用の文字が追加されている。Apple標準システム外字のうちUnicodeに対応している文字には次のようなものがある。
Apple標準システム外字
丸附き数字 ・黒丸附き数字
文字
内容
文字
内容
文字
内容
①
○で囲まれた1
⑪
○で囲まれた11
❶
●で囲まれた白抜きの1
②
○で囲まれた2
⑫
○で囲まれた12
❷
●で囲まれた白抜きの2
③
○で囲まれた3
⑬
○で囲まれた13
❸
●で囲まれた白抜きの3
④
○で囲まれた4
⑭
○で囲まれた14
❹
●で囲まれた白抜きの4
⑤
○で囲まれた5
⑮
○で囲まれた15
❺
●で囲まれた白抜きの5
⑥
○で囲まれた6
⑯
○で囲まれた16
❻
●で囲まれた白抜きの6
⑦
○で囲まれた7
⑰
○で囲まれた17
❼
●で囲まれた白抜きの7
⑧
○で囲まれた8
⑱
○で囲まれた18
❽
●で囲まれた白抜きの8
⑨
○で囲まれた9
⑲
○で囲まれた19
❾
●で囲まれた白抜きの9
⑩
○で囲まれた10
⑳
○で囲まれた20
丸括弧附き数字
文字
表記
文字
表記
文字
表記
文字
表記
文字
表記
⑴
(1)
⑸
(5)
⑼
(9)
⒀
(13)
⒄
(17)
⑵
(2)
⑹
(6)
⑽
(10)
⒁
(14)
⒅
(18)
⑶
(3)
⑺
(7)
⑾
(11)
⒂
(15)
⒆
(19)
⑷
(4)
⑻
(8)
⑿
(12)
⒃
(16)
⒇
(20)
ドット附き数字
文字
表記
文字
表記
文字
表記
⒈
1.
⒋
4.
⒎
7.
⒉
2.
⒌
5.
⒏
8.
⒊
3.
⒍
6.
⒐
9.
大文字および小文字のローマ数字
文字
表記
文字
表記
文字
表記
文字
表記
文字
表記
文字
表記
Ⅰ
I
Ⅴ
V
Ⅸ
IX
ⅰ
i
ⅴ
v
ⅸ
ix
Ⅱ
II
Ⅵ
VI
Ⅹ
X
ⅱ
ii
ⅵ
vi
ⅹ
x
Ⅲ
III
Ⅶ
VII
Ⅺ
XI
ⅲ
iii
ⅶ
vii
ⅺ
xi
Ⅳ
IV
Ⅷ
VIII
Ⅻ
XII
ⅳ
iv
ⅷ
viii
ⅻ
xii
丸括弧附きアルファベット小文字
文字
表記
文字
表記
文字
表記
文字
表記
文字
表記
文字
表記
文字
表記
⒜
(a)
⒠
(e)
⒤
(i)
⒨
(m)
⒬
(q)
⒰
(u)
⒴
(y)
⒝
(b)
⒡
(f)
⒥
(j)
⒩
(n)
⒭
(r)
⒱
(v)
⒵
(z)
⒞
(c)
⒢
(g)
⒦
(k)
⒪
(o)
⒮
(s)
⒲
(w)
⒟
(d)
⒣
(h)
⒧
(l)
⒫
(p)
⒯
(t)
⒳
(x)
単位記号
文字
表記
文字
表記
文字
表記
文字
表記
文字
表記
文字
表記
文字
表記
㎜
mm
㎝
cm
㎢
km2
㎖
ml
㎳
ms
℉
°F
㎅
KB
㎟
mm2
㎠
cm2
㎎
mg
㎗
dl
㎲
μs
㏔
mb
㎆
MB
㎡
m2
㎤
cm3
㎏
kg
ℓ
l
㎱
ns
㏋
HP
㎇
GB
㎥
m3
㎞
km
㏄
cc
㎘
kl
㎰
ps
㎐
Hz
アルファベットの組文字
文字
表記
文字
表記
文字
表記
№
No.
㏍
K.K.
℡
TEL
スート (トランプ記号)
文字
内容
文字
内容
♠
スペード記号
♤
白抜きスペード記号
♥
ハート記号
♡
白抜きハート記号
♦
ダイヤ記号
♢
白抜きダイヤ記号
♣
クローバー記号
♧
白抜きクローバー記号
矢印記号
文字
内容
文字
内容
文字
内容
☝
指さし矢印上
⇧
白抜き矢印上
⇅
↑↓
☟
指さし矢印下
⇩
白抜き矢印下
⇄
→ ←
☜
指さし矢印左
⇦
白抜き矢印左
⇆
← →
☞
指さし矢印右
⇨
白抜き矢印右
丸括弧附き漢字
文字
表記
文字
表記
文字
表記
文字
表記
文字
表記
㈰
(日)
㈮
(金)
㉃
(至)
㈴
(名)
㈵
(特)
㈪
(月)
㈯
(土)
㈹
(代)
㈲
(有)
㈼
(監)
㈫
(火)
㉀
(祭)
㈺
(呼)
㈻
(学)
㈽
(企)
㈬
(水)
㈷
(祝)
㈱
(株)
㈶
(財)
㈿
(協)
㈭
(木)
㉂
(自)
㈾
(資)
㈳
(社)
㈸
(労)
囲み文字
文字
内容
文字
内容
文字
内容
文字
内容
㊤
○で囲まれた上
㊧
○で囲まれた左
㊖
○で囲まれた財
㊞
○で囲まれた印
㊥
○で囲まれた中
㊨
○で囲まれた右
㊝
○で囲まれた優
㊙
○で囲まれた秘
㊦
○で囲まれた下
㊩
○で囲まれた医
㊘
○で囲まれた労
組文字
文字
表記
文字
表記
文字
表記
文字
表記
㍉
ミリ
㌶
ヘクタール
㍊
ミリバール
㌪
ハイツ
㌔
キロ
㍑
リットル
㌻
ページ
㌱
ビル
㌢
センチ
㍗
ワット
㌀
アパート
㌳
フィート
㍍
メートル
㌍
カロリー
㌅
インチ
㌹
ヘルツ
㌘
グラム
㌦
ドル
㌕
キログラム
㍂
ホーン
㌧
トン
㌣
セント
㌖
キロメートル
㍇
マンション
㌃
アール
㌫
パーセント
㌞
コーポ
㍎
ヤード
㍿
株式会社
数学記号
文字
内容
文字
内容
文字
内容
∮
閉曲線積分 (閉路積分・周回積分)記号
∟
直角記号
⊿
直角三角形
引用符
文字
内容
文字
内容
〝
始めダブルミニュート 日本語用の「“」
〟
終わりダブルミニュート 日本語用の「”」
濁点 附きのひらがな・カタカナ
文字
表記
文字
表記
文字
表記
文字
表記
文字
表記
ゔ
う゛
ヷ
ワ゛
ヸ
ヰ゛
ヹ
ヱ゛
ヺ
ヲ゛
縦書き用の文字
縦書き用文字には、括弧 などの記号を回転させたものと、句読点 と小書きの仮名 を右上に寄せたものがある。「︰ 」(二点リーダ)、「︙ 」(三点リーダ)、「︵ 」「︶ 」(括弧)、「︻ 」「︼ 」(すみ付き括弧)など。三点リーダは U+FE19 に収録されているが、MacJapaneseのコードポイントとは異なり、互換性はない。
これらは、DTP などの縦書きに対応したアプリケーションで縦書き表示をする際に、本来の文字コードを変換してQuickDraw の描画API に渡すために使われたものである。通常、情報交換に使われることはない。
他の文字コードとの対応
全角文字に関しては、縦書き用文字を別にすると、次のように区分できる。
区分1
NEC特殊文字 にある文字。73字。
シフト符号化表現で符号化すると、MacJapaneseと Windows-31J 、Shift_JIS-2004 とでは別のコードポイントが与えられているために、機種依存文字 として文字化け の原因となる。例えば「⑫ 」(○で囲まれた「12」)は Windows-31J や Shift_JIS-2004 では 0x874B に割り当てられているが、MacJapanese においては 0x874B に「㈹ 」(「(代)」)が割り当てられているといった具合である。Unicode においては同じコードポイントが与えられているため、文字化けは発生しない。
区分2
NEC特殊文字になく、JIS X 0213 にはある文字。53字。
区分1と同じく、Shift_JIS-2004 で表現するとMacJapaneseとは別のコードポイントが割り当てられているため、文字化けの原因となる。
区分3
NEC特殊文字にも JIS X 0213 にもなく、Unicode にはある文字。109字。
Unicodeのエンコーディング(UTF-16 、UTF-8 など)を用い、対応する文字のグリフ が存在するフォントを利用すれば、正常に情報交換することができる。仮にMacJapaneseを用いて情報交換し、Unicode に変換しようとした場合には、「Unicode と MacJapanese の変換テーブル」を使わないと変換することができない。
区分4
NEC特殊文字にも JIS X 0213 にもUnicode にもないが、Unicodeでは文字合成で表せる文字。3字。
囲み文字 であり、記号用ダイアクリティカルマークU+20DDを用いた文字合成で表現するか、CSS の OpenType feature tag で表現する。そのため、対応していないOS・フォントやアプリケーションで表示しようとしても、合成されるべきところが合成されずに表示される[ 2] 。文字一覧を下記に記す。文字のうち、左は文字合成、右はCSSの OpenType feature tag を使用したもの。
文字
Unicode
内容
文字
Unicode
内容
文字
Unicode
内容
大⃝
大
U+5927 U+20DD
○で囲まれた大[ 2]
小⃝
小
U+5C0F U+20DD
○で囲まれた小[ 2]
控⃝
控
U+63A7 U+20DD
○で囲まれた控[ 2]
区分5
NEC特殊文字にも JIS X 0213 にもUnicodeにもないが、同型・同用途の文字がUnicodeにある文字。7字。
Unicodeのエンコーディングと対応するフォントを用いて情報交換することはできるが、コードポイントは別であり[疑問点 – ノート ] 、MacJapanese との互換性はない[ 3] 。なお、MacJapanese で入力[ 4] した場合に Unicode へ変換するならば区分7に準ずる。Unicode のコードポイントにある同型の文字一覧を下記に記す。文字が2種類あるものは、左はUnicode、右はCSSの OpenType feature tag を使用したもの。
文字
Unicode
内容
文字
Unicode
内容・表記
⬆
U+2B06
黒塗り矢印上[ 3]
🄀
0
U+1F100
0.[ 3]
⬇
U+2B07
黒塗り矢印下[ 3]
℻
FAX
U+213B
組文字・FAX[ 3]
⬅
U+2B05
黒塗り矢印左[ 3]
⇵
⇆
U+21F5
↓↑[ 5]
➡
U+27A1
黒塗り矢印右[ 3]
区分6
この節には独自研究 が含まれているおそれがあります。 問題箇所を検証 し出典を追加 して、記事の改善にご協力ください。議論はノート を参照してください。(2014年8月 )
NEC特殊文字にも JIS X 0213 にもUnicodeにもないが、同型の別字が JIS X 0213 やUnicodeにある文字[疑問点 – ノート ] 。2字。
区分5と同様に、別のコードポイントに同型の文字があるもの。この同型の文字は、MacJapaneseおよびJIS X 0213やUnicodeに収録されている。共に全角ラテン文字と同型。なお、MacJapanese で入力した場合に Unicode へ変換するならば区分7に準ずる。Unicode のコードポイントにある同型の文字一覧を下記に記す。
文字
Unicode
内容 (mac)
内容 (Unicode)
文字
Unicode
内容 (mac)
内容 (Unicode)
ⅿ
U+217F
メートル記号
ローマ数字小文字1000
ℊ
U+210A
グラム記号
スクリプト体小文字g(実数記号)
区分7
NEC特殊文字にも JIS X 0213 にもUnicodeにもなく、同型・同用途の文字もUnicodeにない文字。9字。
文字合成を行なったり異体字 タグを利用したりして表現することになる。そのためにUnicodeの私的領域であるU+F860、U+F861、U+F862、U+F87A、U+F87E、U+F87Fを使っている。したがって、MacJapaneseに対応していないフォントやアプリケーションで表示しようとしても、合成されるべきところが合成されずに表示されたり、異体字となったりする[ 4] 。記号一覧を下記に記す。記号が2種類あるものは、右はCSSの OpenType feature tag を使用したもの。
記号
Unicode表記
内容
記号
Unicode表記
内容
記号
Unicode表記
内容
有限会社
U+F862 U+6709 U+9650 U+4F1A U+793E
組文字・有限会社
XIII
U+F862 U+0058 U+0049 U+0049 U+0049
ローマ数字13大文字
xiii
U+F862 U+0078 U+0069 U+0069 U+0069
ローマ数字13小文字
財団法人
U+F862 U+8CA1 U+56E3 U+6CD5 U+4EBA
組文字・財団法人
XIV
U+F861 U+0058 U+0049 U+0056
ローマ数字14大文字
xiv
U+F861 U+0078 U+0069 U+0076
ローマ数字14小文字
TB
TB
U+F860 U+0054 U+0042
単位・テラバイト
XV
U+F860 U+0058 U+0056
ローマ数字15大文字
xv
U+F860 U+0078 U+0076
ローマ数字15小文字
macOS での対応
macOS においては、MacJapaneseは「Shift_JIS (Mac)」(文字パレット)あるいは「日本語 (Mac OS)」(テキストエディット )と表現される。
また、macOS附属のフォントではOsaka のみがMacJapaneseに完全対応している。ヒラギノ はUnicodeとAdobe-Japan1 文字コレクションに対応しているため、Unicodeを扱えるアプリケーション上ではUnicodeに対応する文字が存在しない18字(上記の区分5〜7)を除いてMacJapaneseの文字を表示できる。一方、CID を扱えるアプリケーション上でヒラギノを使う場合には、halfwidth horizontal ellipsis (半角三点リーダー)以外の文字を全て表示できる。
iPod での対応
脚注
関連項目
外部リンク
日本語 用の 文字コード
日本語を含む 多言語文字集合
日本語以外用の 文字集合
ソフトウェア 区分け 概念 関連トピック
カテゴリ