2009年08月07日 15:00 [Edit]

Unicode - JISマークは一文字!

私もびっくりしたのですが、事実です。


まずは以下をご覧下さい。

〄は一文字です(U+3004)。

フォントまわりをカスタマイズしていないIEでも表示を確認できました。UbuntuのFirefoxでは空白でしたが。

なぜ気がついたかと言えば、unicode@unicode.org にこんな書き込みが登場したからです。

At http://en.wikipedia.org/wiki/Japanese_Industrial_Standards, a new symbol for JIS is shown and discussed. Will there be a new character in the Standard? (Not a new glyph in the same codepoint, I hope!!)
JISマークが刷新されたけど、Unicodeは割り当てられるの?(新グリフを同じコードポイントに割り当てるのは勘弁な!)

確かに、よく見るとU+3004は、旧JISマークとして表示されています。というか、JISってロゴ変わったんだ。

その答えは後回しにして、これに対する返事でU+FFFD吹いた。

If this is a character, those should be glyph variants.
これが文字だとしたら、異字体に決まってんだろJK

異字体www。彈と弾みたいなものであると。

しかし、それ以前になんで一団体のロゴがコードポイントもっているのでしょう。ISOのロゴすらもっていないのに。

他にもこういう例がないかと調べてみると、ありました。

 
% grep STANDARD /usr/local/lib/perl5/5.10.0/unicore/Name.pl
3004		JAPANESE INDUSTRIAL STANDARD SYMBOL
327F		KOREAN STANDARD SYMBOL

㉿も一文字ですが、表示できるかな?

しかし、なぜ日本と韓国の工業標準団体のロゴだけが、Unicodeされてるんだ? JIS X 0208にもJIS X 0213にも「JIS一文字」なんてないのに。

犯人は酒井法子より意外でした。

% grep 3004 ~/cpan/Encode/trunk/ucm/*.ucm
/Users/dankogai/cpan/Encode/trunk/ucm/macJapanese.ucm: \x86\xB5 |0 # JAPANESE INDUSTRIAL STANDARD SYMBOL

なんと、犯人はAppleだったのです。

なんでこんなことになったかいえば、それがたまたま macJapanese に登録されていて、そして Unicode が制定されるときに、それまでの主立った文字コードとのラウンドトリップ互換性 -- Unicodeに変換して元に変換しなおせる -- ことを保証したからなのです。その「これまでの文字コード」の中に、macJapaneseが入っていたのだと(おかげでEncodeでもサポートしています)。

JISの中の人も、知らなかったでしょうね。まさか自分ところのロゴが知らない間に国際規格になっていたなんて!

実は、同じ理由で Apple のロゴも Unicode にあります。以下をご覧下さい。

http://unicode.org/Public/MAPPINGS/VENDORS/APPLE/KEYBOARD.TXTより
UnicodeAppleDescription
U+21E50x02RIGHTWARDS ARROW TO BAR # Tab right (left-to-right text)
U+21E40x03LEFTWARDS ARROW TO BAR # Tab left (right-to-left text)
U+23240x04UP ARROWHEAD BETWEEN TWO HORIZONTAL BARS # Enter key
U+21E70x05UPWARDS WHITE ARROW # Shift key
U+23030x06UP ARROWHEAD # Control key
U+23250x07OPTION KEY # Option key
U+24230x09OPEN BOX # Space key (Mac OS X mapping, duplicates mapping for 0x61, hence no round-trip)
U+23260x0AERASE TO THE RIGHT # Delete right (right-to-left text)
U+21A90x0BLEFTWARDS ARROW WITH HOOK # Return key (left-to-right text)
U+21AA0x0CRIGHTWARDS ARROW WITH HOOK # Return key (right-to-left text)
U+F8020x0Flower left pencil
U+21E30x10DOWNWARDS DASHED ARROW
U+23180x11PLACE OF INTEREST SIGN # Command key
U+27130x12CHECK MARK
U+25C60x13BLACK DIAMOND
U+F8FF0x14Apple logo
U+232B0x17ERASE TO THE LEFT # Delete left (left-to-right text)
U+21E00x18LEFTWARDS DASHED ARROW
U+21E10x19UPWARDS DASHED ARROW
U+21E20x1ARIGHTWARDS DASHED ARROW
U+238B0x1BBROKEN CIRCLE WITH NORTHWEST ARROW # Escape key; for Unicode 3.0 and later
U+23270x1CX IN A RECTANGLE BOX # Clear key
U+00200x20SPACE
0U+00300x30DIGIT ZERO
1U+00310x31DIGIT ONE
2U+00320x32DIGIT TWO
3U+00330x33DIGIT THREE
4U+00340x34DIGIT FOUR
5U+00350x35DIGIT FIVE
6U+00360x36DIGIT SIX
7U+00370x37DIGIT SEVEN
8U+00380x38DIGIT EIGHT
9U+00390x39DIGIT NINE
FU+00460x46LATIN CAPITAL LETTER F
U+24230x61OPEN BOX # Blank key
U+21DE0x62UPWARDS ARROW WITH DOUBLE STROKE # Page up key
U+21EA0x63UPWARDS WHITE ARROW FROM BAR # Caps lock key
U+21900x64LEFTWARDS ARROW
U+21920x65RIGHTWARDS ARROW
U+21960x66NORTH WEST ARROW
?⃝U+003F U+20DD0x67QUESTION MARK + COMBINING ENCLOSING CIRCLE # Help key
U+21910x68UPWARDS ARROW
U+21980x69SOUTH EAST ARROW
U+21930x6ADOWNWARDS ARROW
U+21DF0x6BDOWNWARDS ARROW WITH DOUBLE STROKE # Page down key
U+F8FF U+F87F0x6CApple logo, outline
U+F8030x6DContextual menu key symbol
❘⃝U+2758 U+20DD0x6ELIGHT VERTICAL BAR + COMBINING ENCLOSING CIRCLE # Power key
F1U+F860 U+0046 U+00310x6Fgroup_2 + F + 1 # F1 key
F2U+F860 U+0046 U+00320x70group_2 + F + 2 # F2 key
F3U+F860 U+0046 U+00330x71group_2 + F + 3 # F3 key
F4U+F860 U+0046 U+00340x72group_2 + F + 4 # F4 key
F5U+F860 U+0046 U+00350x73group_2 + F + 5 # F5 key
F6U+F860 U+0046 U+00360x74group_2 + F + 6 # F6 key
F7U+F860 U+0046 U+00370x75group_2 + F + 7 # F7 key
F8U+F860 U+0046 U+00380x76group_2 + F + 8 # F8 key
F9U+F860 U+0046 U+00390x77group_2 + F + 9 # F9 key
F10U+F861 U+0046 U+0031 U+00300x78group_3 + F + 1 + 0 # F10 key
F11U+F861 U+0046 U+0031 U+00310x79group_3 + F + 1 + 1 # F11 key
F12U+F861 U+0046 U+0031 U+00320x7Agroup_3 + F + 1 + 2 # F12 key
F13U+F861 U+0046 U+0031 U+00330x87group_3 + F + 1 + 3 # F13 key
F14U+F861 U+0046 U+0031 U+00340x88group_3 + F + 1 + 4 # F14 key
F15U+F861 U+0046 U+0031 U+00350x89group_3 + F + 1 + 5 # F15 key
U+23880x8AHELM SYMBOL # Control key (ISO standard), Unicode 3.0 and later
U+23870x8BALTERNATIVE KEY SYMBOL # Unicode 3.0 and later
U+23CF0x8CEJECT SYMBOL # Unicode 4.0 and later, Mac OS X only
英数U+82F1 U+65700x8DJapanese "eisu" key symbol # Mac OS X only
かなU+304B U+306A0x8EJapanese "kana" key symbol # Mac OS X only
F16U+F861 U+0046 U+0031 U+00360x8Fgroup_3 + F + 1 + 6 # F16 key, Mac OS X only

ただし、あくまで互換性のために用意されたに過ぎず、PRIVATE USE = 外字扱いとなっています。

コマンド記号 - Wikipedia
アップルコンピュータのMacintoshでは、修飾キーとして、コマンドキーとよばれるキーが使用され、アップルマーク(ユニコードではU+F8FFで「」であるが、現在のUnicodeには実装されておらず外字として使用される)が刻印されていたが、1984年に発売されたMacintoshからはアップルマークと併用してコマンド記号も刻印されるようになり、2007年に発売された機種からは、コマンド記号のみになった。

同様のいきさつで入ってしまったJISマークが、立派な記号文字として分類されて、「新旧字体」がうんぬんされるようになったのとは対象的です。しかも、おそらくJISの与り知らぬところで。

どうでもいいことを押尾学んでしまった。

Dan the Reluctant Unicoder


この記事へのトラックバックURL

この記事へのコメント
JASマークは何で入らなかったんでしょう?

Appleにいる(いた)当事者に聞かないとわかんないだろうけれど。
Posted by sakurada at 2009年08月07日 18:08
お祭りですね。。
Posted by anon at 2009年08月07日 16:48
彈と弾は異字体というより異体字な気がします
Posted by かんじ at 2009年08月07日 15:41