2006年05月22日

hyoshok さんにそそのかされたので, 少々昔話をしてみよう.ちょうど「補助漢字の思い出」が公開されたこともあり, 今回のテーマは「補助漢字と日本語 EUC」である.

日本語 EUC の補助漢字対応に語るには,まず JIS X 0212 研究会について説明する必要があるだろう.

1990年ごろ,新しく JIS の文字コード規格として「補助漢字」なるものが制定されることが一般に明かになり, 一方で ISO では ISO/IEC 10646 の DIS (Draft International Standard) が出てこようという時期で, さらに Unicode の検討も進んでいる (当初は ISO/IEC 10646 と Unicode はまったくの別物だった) という状況で, 文字コードに関心をもつ国内の企業・大学の有志が集まり, JIS X 0212 補助漢字を既存のシフト JIS や日本語 EUC でどのようにサポートすべきか, さらには新しい国際文字コードへの対応はどのようにすべきか,といったことを議論したのが,この JIS X 0212 研究会である.

この JIS X 0212 研究会の成果として,「中間報告」という文書が公開された. (恥ずかしながら,当時の記録は手元にほとんど残っておらず,この中間報告についても,1991年2月1日付の英訳版のプリントアウトしかない.いま Google 等で検索しても,この中間報告は見つからない.) この中間報告には,シフト JIS や日本語 EUC に対する補助漢字対応の拡張案が複数提案されており, これを見て,業界としても日本語 EUC における補助漢字への対応を公式に示す必要に迫られ,1991年12月に公開したのが「UI-OSF 共通日本語 EUC」である. なお,発表は,当時日本UNIXユーザ会 (jus) が主催していた 「UNIXフェア」の会場で1991年12月12日に行われた. 当時は新宿西口の NS ビルの地下でやっていたと記憶している.

この共通日本語 EUC が,現在の EUC-JP (eucJP) の原型となったものである.

この「UI-OSF 共通日本語 EUC」の発表についても,やはり公式のものはインターネット上に見当たらないのだが,いくつかコピーはある.それらは,次の通りである.

さて,共通日本語 EUC の内容であるが, 本文 (日本語 EUC の定義) はほんの1ページ程度しかない,短いものである.その後ろについた解説の方がよっぽど長いくらいだが,規定部分については本文のみを見ればよい.解説はしょせん解説であり,参考以上のものではない.[詳細は上のリンク先を見て欲しい.]

本文はまず「適用範囲」からはじまる.ここで AJEC (Advanced Japanese EUC) という略称が出現する.この名前は,

  • 他の日本語 EUC とは異なる何らかの略称をつけたい
  • しかし,この略称が定着し,たとえば iconv の引数として使われるのは避けたい

という,なんとも複雑な要求のもとでつけられたものである. (そのように強く主張する人がいたのだけれど, 何故そういう主張がでてきたものか,私はもう覚えていない.) まったくその意図のとおり,いまでは誰も覚えていない,関係者も忘れている名前である. eucJP あるいは EUC-JP という名前が出てくるには,もう少し待たねばならない.

次の「日本語 EUC の定義」は,説明の必要はないだろう.

その後に,「未定義領域の使用法」として,JIS X 0208 及び JIS X 0212 の後ろの方にある空き領域についての使用方法が規定されている. といっても,ユーザー定義文字を割り当ててもよく,ベンダー定義文字を割り当ててもよい,と言っているだけで,特に「どうしなければならない」という規定ではない. 「どっちに使ってもいいんだよ」という意味の,ある種の「お墨付き」的な効果をねらったものである.

最後に,「コードの透過性」の規定がある. これは,特に空き領域のコードポイントについて, 「コード変換などの際に,文字が割り当てられていないからといって, 捨ててしまってはいけないよ」という規定だが,今のように,中間コード/内部コードとして Unicode を使う実装が増えてくると,これを守るのも困難だろう.

補助漢字と日本語 EUC について,私の覚えているのは以上である. おそらく記憶違いもたくさんあると思うので, まあ,話半分程度に読んでいただきたい. また,間違いを見つけたら,容赦なく指摘して欲しい.

補足: 当時は UNIX に関連する団体として次のものがあった.

  • UNIX System Laboratories (USL) ― UNIX の元祖である Bell Labs. のソースコードに起源をもつ UNIX System V の開発元.当時は AT&T の一部門であった. USL はその後 AT&T から Novell に売られ, SCO に売られ,Caldera に売られて,現在の SCO になった.(ちょっと途中経過の記憶が怪しい.)
    日本では1980年代半ば(?)に AT&T UNIX Pacific の名前で日本法人が設立され, その後,UNIX System Operations Pacific (USOP), UNIX System Laboratries Pacific (USLP) と名を変えた.この頃は事務所が新橋にあったのを覚えている.
  • Open Software Foundation (オープン・ソフトウェア・ファウンデーション, OSF) ― IBM, DEC, HP 等が作った団体.OS の OSF/1 のほか,DCE (Distributed Computing Environment) の開発を行っていた. 当時は青山に事務所があった.
  • UNIX International, Inc. (UNIX インターナショナル, UI) ― Sun, USL 等が作った団体.UNIX System V の標準化を行っていた. 日本の事務所は当初,神田淡路町にあり,後に亀戸に移った.
  • X/Open Co. Ltd. (X/Open) ― OSF とも UI とも中立な団体として, UNIX の標準化及び標準適合製品の認定を行っていた. 後に OSF と合併して The Open Group となった. 当時は神田淡路町に事務所があった.
  • UniForum ― UNIX のユーザー団体.X/Open と共同で Joint Internationalization Group を構成し,国際化関連仕様の標準化を検討していた. この当時検討されていた仕様が ISO C 言語規格に ISO/IEC 9899/Amd. 1 Multibyte Support Extension (MSE) として取り込まれた.
  • ISO/IEC JTC1 SC22/WG15 ― ISO での UNIX API の標準である ISO/IEC 9945 POSIX (Portable Operating System Interface) の標準化を行っていた. 日本では,情報処理学会・情報規格調査会の中に SSI/POSIX 委員会 (SSI は System Software Interface の略.後に SC22/POSIX 委員会となった) があり,活動していた.

[追記 (2006-06-16)] 「日本語EUCの定義」だが, Unapproved Draft 1.7 と書いてある版が Internet 上にあることを確認した.この版は,Unapproved Draft とフッターに書いてあるけれど,実は最終版と同じものである.伊藤氏のところにある版は一部文字が抜けているところがあったけれど,それは編集ミスか,それとも nroff の処理系の違いでそうなったのか,わからない.とにかく,この点については修正する.



(23:26)

トラックバックURL

この記事へのトラックバック

1. UI-OSF日本語環境実装規約  [ numa's diary ]   2007年06月08日 21:59
UI-OSF日本語環境実装規約が、いつのまにかリンク切れになっておりました。 申し訳ありません。一応、「Linux における日本語ロケールに関する指針」などから参照されている関係上、参照できない状態になるのはまずいので、自分のページに置きました。こちらを参照してくだ....
2. 旧 opengroup.or.jp にあった OSF/JVC 関連ファイルの再公開  [ numa's diary ]   2007年06月09日 04:35
旧 opengroup.or.jp 内にあった、 http://www.opengroup.or.jp/jvc/cde/cde.html 以下のファイルが消滅しているようです。まあ、もはや何の関係もないサイトになっているから、それはいいんですが、いろいろ参照されているので、これも、自分のサイトに移しました。archive....
3. 日本語ロケール関連ファイル  [ numa's diary ]   2007年06月09日 05:12
ついでに、日本語ロケール関連ファイルです。 UI-OSF日本語環境実装規約 Version 1.1 旧URL: http://www.openi18n.org/~numa/uocjle-a4.pdf 新URL: http://home.m05.itscom.net/numa/uocjle-a4.pdf UI-OSF Application Platform Profile for Ja...
4. リンク切れファイル  [ numa's diary ]   2014年05月28日 16:28
以前、次の記事からリンクしていた各種ファイルがリンク切れになっております。申し訳ありません。 補助漢字と日本語 EUC UI-OSF日本語環境実装規約 旧 opengroup.or.jp にあった OSF/JVC 関 ...

この記事へのコメント

1. Posted by 成瀬5    2010年09月30日 07:31
こんにちは。http://www.iana.org/assignments/charset-reg/CP51932 を登録した成瀬といいます。
以前日本語EUCがどこから来たのか調べたりしていたのですが、http://d.hatena.ne.jp/nurse/20090308 「eucJP あるいは EUC-JP という名前が出てくるには,もう少し待たねばならない.」について、これは具体的にはいつなのでしょうか。
eucJPが「UI-OSF 日本語環境実装規約」で(つまりlocale名標準化の文脈)、EUC-JPがIANA Charsetの文脈だと想像しているんですが、特に後者の資料がみつからず。

HTML5の文脈に絡んでこの辺を交通整理したいと思っているのです。http://www.w3.org/Bugs/Public/show_bug.cgi?id=7444

コメントする

名前
URL
 
  絵文字