一般社団法人 文字情報技術促進協議会
会長
小林 龍生
15周年記念シンポジウムへのお誘い
2025年12月12日(金)13:00〜17:30、東京駅前のJPタワーカンファレンスルームで、題記のシンポジウムを開催します。
当協議会は、前身にあたるIVS技術促進協議会として発足してからちょうど15年となります。区切りがいいということもありますが、IVSを初めとする文字情報技術が、国際標準化活動を含む標準開発の段階、OSやサーバー、ネットワークシステムなどの基盤システムへの実装の段階をほぼ終え、今後の公共システムや民間の大規模システムなどへの積極的な実装運用に重点が移っていきつつ時期でもあり、みなさまに、文字情報技術の《最前線の今》に直に接していただく機会として企画しました。ユニコード技術委員会の主要メンバーであり、漢字部分の標準化作業グループのリーダーも務めるケン・ランディさんを初め、デジタル庁 デジタル社会共通機能グループ 統括官の楠正憲さん、文化庁国語課主任国語調査官の武田 康宏さん、そして、当協議会副会長で国立国語研究所の高田智和さんと、まさに文字情報技術を第一線で引っ張っておられる方々が、ご講演くださいます。現場の熱気を直接感じ取っていただくため、敢えてオンライ配信はせずに、対面参加のみとしました。年末でみなさん多忙を極める時期だと思いますが、どうか万難を排してご参集いただきますようお願い申し上げます。
以下、ぼくの、協議会と講師の方々との半ば私的な思い出を。
ぼくは、1976年に、2度の留年を経て、ようやく大学を卒業し、小学館の学年別学習雑誌の編集者として、社会人としての人生をスタートしました。爾後約半世紀、大きく分けると3つの時期に区切ることが出来ます。
- 1976〜1989:小学館時代
- 1989〜2009:ジャストシステム時代
- 2009〜現在:CITPC時代
ざっくり、15年、20年、15年といった区切りになります。ジャストシステム時代がやや長いようですが、社員として属していたのは、1998年までで、それ以降は、浮川和宣・初子ご夫妻の御厚意で、ジャストシステムとのコンサルタント契約の下で、国際標準化活動や同社の製品企画に係わっていました。浮川夫妻が、ジャストシステムの経営から離れ、新たにメタモジ社を設立されたのが、2009年10月、それに先立つ9月までで、ぼくと同社とのコンサルタント契約が終了しました。考えてみれば、ぼくのユニコードを軸とする国際標準化活動は、浮川夫妻のパトロネージュに支えられていた、と言っても過言ではありません。
もう、今までのような活動はムリかなあ、と思い詰めていたら、IRGやUTCでご一緒していた当時日本マイクロソフトの阿南康宏さんが、声を掛けてくれました。
「一度、加治佐とお会いになりませんか?」
日本のマイクロソフトの技術責任者を務めておられた加治佐俊一さんとは、もちろん、知らぬ仲ではなかったのですが、文字情報技術世界でも、そして、村田真さんと故樋浦秀樹さんが死闘を演じたワープロなどの文書規格標準を巡る戦いでも、どちらかというと、敵同士といった塩梅でした。加治佐さんとは、どんなことになるかと思いながら、新宿の喫茶店でお目にかかりました。加治佐さんからのお話は、意外なものでした。
「一緒に何か日本語のためになることをやりましょう」
この言葉だけで、日本マイクロソフトは、ぼくとの間にコンサルタント契約を結んでくださいました。主なミッションは、JSC2へのマイクロソフトの帽子をかぶっての委員としての参加と、IVS技術の普及促進活動。直接のカウンターパートとして、加治佐さんが指名してくださったのが、そのころアメリカ本社勤務から帰国したばかりの、バリバリエンジニアだった田丸健三郎さん。
田丸さんを中心として始まったのが、そのころはなかなか実装が進んでいなかったIVS技術を普及促進するための任意団体の設立準備。今から振り返っても、この準備活動は、本当に楽しいものでした。フォント業界、印刷業界、システムインテグレーターなどなど、IVS技術を実装する側から、IVS技術を用いてシステム開発や応用製品を開発する側まで、さまざまな業界の現場の仲間が集まって、まさに梁山泊でした。幾度もの準備会合を経て、IVS技術促進協議会が発足したのが、2010年12月。協議会の会長には、ぼくの後任としてISO/IEC JTC1/SC2の国際議長を勤めておられた長岡技術科学大学の三上喜貴さんが就任してくださいました。もちろん、事務局長は田丸健三郎さん。
爾来、15年。協議会の名称は、文字技術促進協議会に変わり、任意団体から一般社団法人になり、三上さんが本務校で副学長に就任されて多忙を極めたことを機に、ぼくが2代目の会長になり。ぼくが、故樋浦秀樹さんと共に戦ったユニコード標準を巡る物語を綴った「ユニコード戦記」を上梓したのは、2011年6月でした。その最後は、こんな言葉で結びました。
情報通信技術の社会的責務についての認識を深める活動、標準化された符号化文字の実用的実装に向けた活動など、まだやらなければならないことは多々残されている。ぼくも、情報通信技術に携わっている人間の一人として、他の仲間とともに社会に対して文化に対して、やはり大きな責務を負っている。そして、それはまた、戦い半ばにして逝ったヒデキに対する相棒(バディ)としての責務でもある。
「小林さん、泣いている暇なんてありませんよ」
戦闘開始。
どうか、この15年を日本語の技術と文化のために戦ってきた仲間たちの戦地報告をお楽しみください。
文字情報トレンドVol.2
2025年3月14日(金)当協議会主催のオープンセミナー、文字情報トレンドVol.2が開催された。冒頭の会長挨拶以外は、聴衆の一人として聴いていた。じつに面白かった。このブログをお読みいただいている方の多くは、会場なりオンラインなりで参加してくださったと思うけれど、参加できなかった方々は、イワタの水野社長が、ビデオ記録を整理してアップしてくださったので、下記を参照していただきたい。
ぼくなりの感想を二三。
セッション1は、「デジタル組版(Web組版)の現在と未来」と題する木田泰夫さんの講演。
木田さんは、元アップルのエンジニアで、ことえり開発のころから、アップル製品の日本語に係わる部分のディレクションに係わってきた有名人。アップル社と引退したのを機に、そのころぼくが係わっていた電子書籍周辺の標準化活動に引き込んだ。今では、W3CのJLreq-Dタスクフォースのバリバリの議長殿。
JLreqのオリジナルは、小林敏さんが中心となって活版印刷の伝統を継承する形で、紙の印刷物を電子化するという視点でまとめられたもので、電子組版システムの開発などには活用されたが、Webなどの行長や行数がダイナミックに変化する環境では、いろいろ不都合な点があった。なにより、記述が詳細にすぎるうえに、実装上の優先順位も分かりにくく、W3CのInternatilnal core WGのチームリードであるRichard Ishidaからは、もっと分かりやすく簡潔な改定版を出してほしいと、強く求められていた。
そうした中で、JLreq-Dは、従来のJLreq第2版の改訂作業として開始されたが、ほどなく”-D”を付加することにより、いわばWebを中心とするデジタル表現に特化した方向性を明確に指向するようになった。ま、それも、木田さんの英断によるところ大なのだけれどね。
JLreq-Dそのものが完成するまでには、まだしばらく時間がかかりそうだけれど、今回の木田さんの報告を聴いて、ぼくは、ある種の感銘を受けた。
「木田さん、腰が定まったな」
木田さんの発表は、迷いが吹っ切れたというか、肚を括った、というか、活版印刷の文化を、そのよき伝統は尊重しながらも、盲目的に墨守するのではなく、引き継ぐべきは引き継ぎ、切り捨てるべきは切り捨てる、そして、ボーンデジタルのための新しい日本語の文化を創り出そう、という気概がひしひしと伝わってきた。
ビデオを通してでも、木田さんのそんな気概をくみ取っていただければ幸い。
セッション2は、「文字印刷の歴史(活版からデジタルへ)」と題した、TOPPAN印刷博物館学芸員の本多真紀子さんによる発表。写真植字技術の発明から実用化、写植書体の展開を軸としたもの。ざっくり、百年の歴史。
ぼくが小学館に入社したのは、1976年。もう半世紀も前のことなのだ。最初に配属された学年別学習雑誌「小学六年生」は、本文10折のうち、9折はマンガを含め、オフセット印刷か全凸と呼ばれる写植で打った本文を写真撮りして、一ページごとに凸版を製作した上で、紙型経由で輪転用の凸版を起こす、という技法が取られていたが、学習ページと呼ばれていた最終折だけは、まだ、活版で組んでいた。
昔話をもう一つ。集英社のノンノが創刊されたのが、1971年。写研のナール書体が本文に使われたことで、大きな話題となった。ぼくが小学館に入社したころは、本文組はまだほとんど明朝体で、グラビアページなどに角ゴシック系の例えばゴナなどが使われるようになり始めていた。新入社員として配属された編集部の真新しいデスクの上には、大日本や凸版の活字見本と一緒に、写研とモリサワの書体見本帳が載っていた。小学館の「新選国語辞典」も。そして、写研の書体見本帳は、毎年毎年新しい書体が追加された新しいものが、届けられていた。
本多さんの発表を聴きながら、特に後半部分は、ぼく自身の自分史と重なる部分も多く、まさに自分ごととして、興味は尽きなかった。
一方、前半の石井さんと森澤さんの話。お二人の協業と確執。どちらがいい、どちらが悪い、という話ではない。しかし、このような鬩ぎ合いがあって今がある。ぼくは、この写真植字技術の歴史に触れるたびに、サントリーの鳥井信治郎とニッカウヰスキーの竹鶴政孝のエピソードを思い起こす。
ともあれ、本多さんが話されたような歴史があって、その上に今がある。そして、今。モリサワによる写研書体のデジタルフォント製品化プロジェクトが着々と進行している。
セッション3。村田真による「ディスレクシアとフォント」
村田真は、ここ数年、大阪医科薬科大学の奥村智人さんと、ディスレクシア(読字障害)の児童を対象としたフォントデザインや組版方法と読みやすさとの関係についての実証実験を行っている。XMLやEPUBの国際標準化活動で、悪逆非道な陰謀術数の限りを尽くしてきた(ま、ぼく的にも人のことは言えないが)彼も、改心したということか。
いずれにしても、今までほとんど手が付けられていなかった分野への果敢な挑戦であることは疑いない。
講演の内容自体は、実証実験だけに統計的な数値や図版が多いこともあり、セミナーのヴィデオ記録そのものをご参照いただきたいのだけれど、一つだけ、猛烈に印象に残った言葉がある。
「実証実験をやってみて、自分がいかに分かっていないことを分かったつもりになっていたかを痛感した。今回の実証実験の自分にとっての最大の成果は、ディスレクシアとフォントデザインや組版との関係は、いまだにほとんど何も分かっていない、ということが分かったことだ。」
ちょっと感動したね。
最後のセッションは、会員会社各社気鋭のフォントデザイナーたちのパネルセッション。前回のセッションもだったけれど、デザイナーたちそれぞれの、個性と思い入れが前面に出ていて、すこぶる面白かった。
ぼくの専門は、一応、符号化文字集合ということになっていて、特に、UnicodeやUCSのCJK統合漢字周辺のことがらには係わりが多いので、ついつい何万字にも及ぶ巨大な文字表に関心がいってしまう。そんなわけで、目にするフォントも多くは明朝体でたまにゴシック体や楷書体に限られてしまう。その上、何万字もの漢字の多くが、戸籍であったり登記簿であったりといった行政上不可欠な個人名や地名の表記に係わるものだから、扱っていて面白い、みたいなことはないわけ。
その点、このセッションでの話題の多くは仮名文字のデザインに係わるもので、広告や本の装幀、マンガの表記など、理屈よりも感性に係わる表現を扱ったものだったわけで、若いデザイナーたちの自己表現というか、ユーザーたちの自己表現を支えようという心意気というか、そんな熱気が伝わってくるセッションだった。
ちょうど、大河ドラマにつられて源氏物語(小学館の古典文学全集に収められている現代語訳)を読み進めていた折なので、平安時代の男女(なんにょ)が文(ふみ)に込めた思いと遙かにつながるものがあるのかなあ、などと夢想したりして。
雇い止めその後:阿南さんと加治佐さん
「ユニコード戦記」は、2010年5月の「樋浦秀樹さんを送る会」の描写で終わっている。ヒデキがなくなったのが、2010年4月7日。晩年のというか急逝する直前のヒデキは、必ずしも順風満帆というわけではなかった。スコット・マクネリーにあこがれて、富士通を退社して飛び込んだサン・マイクロシステムズが、ヒデキが力を入れていたオープンソースの世界から退場し、そのタイミングで浮川夫妻に招かれて、ジャストシステムに入社していた。しかし、ヒデキが技術面での指揮を執っていたxfyは、営業面での欧米への無謀とも言える積極展開があだとなって、ジャストシステムの経営基盤を揺るがす状況になっていた。浮川夫妻は、最終的に経営権を委譲し、我が子のように育ててきたジャストシステムと社員をキーエンスに委ねる決断を下した。キーエンスへの株式譲渡が2009年の4月、取締役退任と新会社メタモジ設立が2009年10月。それに先立つ2009年9月、ぼくも、ジャストシステム退社後も続いていた業務委託契約(デジタル文化研究所所長職と国際標準化活動)の打ち切りを通告された。この前後の「ユニコード戦記」の記述
2009年9月、ジャストシステムからの契約打ち切りの通告。
ジャストシステムからの契約打ち切りの通告を受け、ぼくは、インディペンデントになってからも続けていたジャストシステムデジタル文化研究所の所長を退任した。デジ研という組織(もともと、メンバーは、ぼくとアシスタントの斯波綾子さんだけだったけれど)も廃止された。
2010年10月、浮川夫妻、ジャストシステム取締役を退任。
浮川夫妻がジャストシステム取締役を退任。同時に、メタモジ社を設立。
ジャストシステムからの禄を断たれ、路頭に迷いかけたぼくに、救いの手をさしのべてくれたのは、意外にも「一太郎」やATOKで、OOXMLやODFで敵どうしとして戦ってきたマイクロソフトCTO(当時)の加治佐俊一さんだった。
「何か日本語の将来に役立つことをやりましょう」
これだけの条件で、ぼくとコンサルタント契約を結んでくれた。あとは、情報処理推進機構(IPA)の文字情報基盤事業の手伝いで糊口をしのぐことができた。
(「EPUB戦記」p170、一部改)
「EPUB戦記」でのぼくの物語は、事実上、ここで終わっている。あとは、JLreqの第2版の発行と、紙版の「日本語組版処理の要件」の発行、W3CにおけるRichard Ishidaによる様々なreqシリーズへの展開などが、簡単に触れられているだけだ。
一方、「ユニコード戦記」の方は、といえば、これは、2010年5月28日に西麻布のイタリアン・レストラン《エスペリア》で開かれた「樋浦秀樹さんを送る会」の記述が最後。
あとがきで触れた台北の鼎泰豊での村田真や木田泰夫さんとのエピソードが、2010年10 月7日。
こうして見てくると、ぼくの個人史の中で、2010年は、随分と大きな区切りの年だった。
大きく区切ると、
1976年〜1989年:小学館編集者
1989年〜2000年:ジャストシステム社員
2000年〜2010年:インディペンデント(ジャストシステムデジタル文化研究所所長)
2010年〜:インディペンデント(マイクロソフトコンサルタントとCITPCへの係わり)
といったことかしらね。こうして列挙してみると、何のことはない、今となっては2010年以降のCITPCとの係わりが一番長くなってしまった。
2025年12月のCITPC結成15周年に向けて、2010年を起点として、今に至るまでぼくの活動の中軸となってきた文字情報技術促進協議会(前身のIVS技術促進協議会も含む)と、文字情報基盤整備事業について、あくまでもぼく個人の視点からではあるけれど、記録を留めておこう。おそらく、技術的な内容よりも、係わりのあった人々との思い出が中心になると思うけれど。
加治佐さんとの面談
ジャストシステムから雇い止めを宣告され、ぼくは、マジで路頭に迷いそうになった。2010年といえば、ぼくはまだ50代の最後。普通に会社員をやっていれば、定年まで何年かを残す年代だ。ジャストシステムを退社して、有限会社スコレックスを設立し、インディペンデントのITコンサルタントを標榜してはいたが、じつのところ、ジャストシステムとのコンサルタント契約、それも実態は国際標準化活動に対するパトロネージュが主な生活の糧だった。他にもスポットでの調査の仕事が無いわけではなかったが、生活を支えるにはほど遠いものだった。救いと言えば、3人の子供たちがすでに独立してそれぞれ自分たちの家庭を持っていたことだろうか。
さて、これからの生活をどうしようか、と思い悩んでいたとき、意外な人が声を掛けてくれた。マイクロソフトの阿南さん。
阿南康宏さん
阿南さんとは、JSC2での活動を通して、旧知の仲だった。
今調べてみると、JIS X 0213:2000の符号化文字集合調査研究委員会第2分科会(WG2)の委員名簿に、マイクロソフトプロダクトディベロップメントリミテッド所属として、その名がある。それも、「(平成10年11月から)」という付記とともに。それまでは、「松沢高志さん(平成9年4月まで)」の名があり、JIS X 0208:1997の委員名簿にも、松沢さんの名前があるので、このころ、松沢さんから引き継ぐ形で、符号化文字集合の世界に入ってきたのではないかと思われる。
あれれ、「ユニコード戦記」の人名索引には、阿南さんの名前がない。これ、浦山さん(当時東京電機大学出版局での編集担当)のミスだな、きっと。でも、第6章 JIS X 0213:2004 1 表外漢字字体表とJIS喚起規格の整合の節、符号化文字集合(JCS)調査研究委員会第1回委員会の委員会構成のところに、阿南さんの名前もある。この会合が開かれたのは、2001年5月。
ともあれ、このころには、阿南さんは、外資系ITベンダーの一方の雄であるマイクロソフトにあって、開発陣の最前線で日本語関連の符号化文字集合標準化活動に参画してきた。
ヒデキにとって、阿南さんはちょっと不思議な存在だった。
そもそも、ヒデキからすると、マイクロソフトはあらゆる面で不倶戴天の敵。彼が属していたサンマイクロのUnix路線に対するWindows、Javaに対するC++、そして、後のODFとOOXML等々。ところが、IRGのミーティングでは、ヒデキはUS代表団の一員であるにもかかわらず、なぜか昼食の折には、日本代表団のメンバーにすり寄ってきて、一緒に日本料理店やラーメン屋に出向いたりする。そして、阿南さんとも親しく雑談している。
ヒデキは、ワインに凝っていた。それも、半端なく。自宅にもワインセラーがあったが、置ききれずに、空調の整ったサンマイクロのサーバールームに、何本ものワインをこっそり保管していた。あるとき、ヒデキが知らない間に、サーバールームの引っ越しが挙行され、持ち主不明のまま貴重なワインが没収されてしまう、という悲劇が起こったり。
ぼくも、ヒデキに洗脳されて、ある時期、結構ワイン沼にはまった。
二人で、何度もナパバレーに行った。ナパの多くのワイナリーでプレミアムワインのテイスティングも経験した。そのうち、阿南さんも、そんなナパツアーに参加するようになった。運転はもっぱら阿南さん。二人で、ワインが6本入るおそろいのトートバッグを買い込み、会議でベイエリアに行くたびに、ワインを買い込んだりした。仕事の関係で阿南さんが参加できないときは、バッグを借りていって、都合2つのバッグに12本もの(実はそれ以上)ワインを詰め込んで帰ってきた。阿南さんには、バッグを借りたお礼に、お気に入りのワインを1本進呈した。
ヒデキが日本に来た折には、そんなワインの何本かを持ち込んで、ヒデキが定宿にしていたお茶の水のホテル近くのイタリアンの店で、気の置けない仲間たちと盛り上がったものだった。その場にも、阿南さんは、いた。
そんな阿南さんが、ジャストシステムから雇い止めを喰らったぼくに、メールをくれた。
「一度、MSのCTO、加治佐とお会いになりませんか」
加治佐さん
加治佐さんは、マイクロソフトジャパンのCTOとして、その勇名はとどろいていた。浮川夫妻の口からも度々、その名前が語られていた。ぼくがジャストシステムに入社したころで言えば、東芝の溝口氏やソフトバンクの孫氏など、当時のパソコン業界を先頭に立って引っ張っていたストラテジストの一人、といった印象だった。いわば、雲の上の人。加治佐さんご本人が、ShiftJISそのものをデザインしたことを知ったのは、知遇を得て、親しく交わるようになってからのこと。
その加治佐さんが、自ら乗り込んできたのが、国際標準化活動の中での、ODFとOOXMLの覇権争い。舞台は、IOS/IEC JTC1/SC34。委細は、ぼくの理解と記憶の彼方だが、雑駁に言えば、ヒデキや当時IBMの木戸彰夫さんらが主導していたオープンソースグループのODF対マイクロソフトグループのOOXML。グローバルなデジタル通信ネットワークの世界では、OSIのモデルを押さえて、TCP/IPが覇権を取った。文字コードの世界では、UCSとユニコードが覇権を取った。そして、構造化文書の世界でのHTML。こうした流れの中で、ワードプロセッサーやスプレッドシートなどのビジネスドキュメントの公的なフォーマット規格をどうするか。各社が次の時代のビジネスモデルを構築していく上でも、まさに雌雄を決する大きな戦いだった。
ヒデキは、サンマイクロの大看板を背負って、陣頭に立って戦っていた。そんな戦場において、JTC1における日本のナショナルボディである情報規格調査会がどちらの側に付くか、それが問題だった。日本マイクロソフトは、加治佐さんの下に、国際標準化活動の世界ではまさに百戦錬磨の村田真を迎えて、いわば柔と剛の絶妙なコンビネーションで挑んできた。
傍から見ていても、まさに血を血で洗うような激戦が繰り広げられた。
結果は。
短期的には、双方の痛み分け。ODFもOOXMLもISO/IECの正規の国際規格として発行された。
中長期的には、OOXMLの一人勝ち。ヒデキは、サンマイクロを去り、サンマイクロそのものも消滅した。その後、ヒデキはジャストシステムに移り、xfyによる世界制覇という浮川夫妻の見果てぬ夢とともに果てることになる。
ユニコード戦記の人名索引には、加治佐さんの名前もある。該当個所は、こんな感じ。
そして、ヒデキは日本マイクロソフトの最高技術責任者の加治佐俊一さんとも食事をした。加治佐さんがマイクロソフトとしてIVS技術を目本で強力に推進する決意を話すと、ヒデキはとてもうれしそうだった。 「今なら、マイクロソフトといっしょに仕事ができそうですね」このテーブルが、今まで何かにつけて対峙しつづけてきたヒデキの、マイクロソフトとの和解の場となった。
(「ユニコード戦記」p.240)
今、ネットで調べてみると、ODFの制定は、2006年5月、OOXMLの制定は、2008年11月。
ヒデキの最後の来日は、2010年の2月だった。ぼく自身、記憶は曖昧なのだが、この時点で加治佐さんとぼくとは、全く知らぬ仲、というわけではなかったようだ。
ともあれ、ぼくがジャストシステムから雇い止めの宣告を受けたことを知った阿南さんが、繋いでくれて、ぼくは加治佐さんのオフィス近くの喫茶店で、加治佐さんと話をした。
委細は覚えていない。「EPUB戦記」の記述によると。
ジャストシステムからの禄を断たれ、路頭に迷いかけたぼくに、救いの手をさしのべてくれたのは、意外にも一太郎やATOKで、OOXMLやODFで敵どうしとして戦ってきたマイクロソフトCTOだった加治佐俊一さんだった。 何か目本語の将来に役立っことをやりましょう」これだけの条件で、ほくとコンサルタント契約を結んでくれた。あとは、情報処理推進機構(IPAの文字情報基盤事業の手伝いで糊口をしのぐことができた。(P170)
加治佐さんは、そのころ、米国本社での最前線の実装部隊を離れて、日本に召喚されていた田丸健三郎さんに、IVSとIVDの日本における何らかの普及活動を、ぼくとともに企画立案することを指示してくれた。こうして、田丸さんとのいわば二人三脚での活動が始まった。
一方の阿南さん。マイクロソフトジャパンの中で、着実にキャリアアップしていたのだと思う。
あるとき、突然
「もう、部下たちのベビーシッティングには飽き飽きしたんですよね」
と、軽やかに宣言して、マイクロソフトを離れ、それまで着実に積み上げていた中国語のスキルをさらに高め、日中間のIT分野での橋渡しに自分自身のビジネスチャンスを拓くべく、勇躍中国に渡っていった。
ぼくの手元には、2012年4月に発行された「日本語組版処理の要件」(東京電機大学出版局)を記念して村田真がエディターたちのために作ってくれたプレートの、阿南さんの分がまだ残っている。
こうして、ぼくは、ヒデキから委ねられた文字情報技術の普及促進を目指す新しい戦場に赴くこととなった。
文字情報技術の30年
謹賀新年
まあ、齢を重ねてくると、新年といっても、これといった新しい感慨はたいして湧いてこない。とはいえ、こと本協議会に限っていえば、今年2025年は、母体となった任意団体IVS技術促進協議会の設立から15年という特別な年になる。先のブログにも書いたけれど、IVS技術促進協議会の設立総会が開催されたのは、2010年12月6日。1年近く先のことにはなるけれど、事務局長の田丸さんを中心に、記念イベントの計画が動き始めている。
協議会が設立された2010年は、ぼくの個人史的にも、わりと際だった年なのだけれど、日本の文字情報技術史全体を見ても、なんというか、箱根駅伝の折り返し点といったところに位置している。
協議会副会長の村田真が日本人としては唯一、グローバルなゼロックスグループの代表として、W3Cのワーキンググループの一員として策定に主体的に係わったXMLの勧告が出されたのが、1998年2月。
協議会の主要メンバーでもあるマイクロソフトとアドビが手を結んで、デジタルフォントのデファクトスタンダードとなっているオープンタイプの最初の版を発表したのが1997年4月。
そして、ぼくの個人史の中でも重要な位置をしめるUCSの第1版の発行が1993年5月。ちなみに、ぼく自身が、当時ジャストシステム専務だった浮川初子さんに、いわば背中を蹴っ飛ばされて参加した最初のユニコード技術委員会が、1995年12月。
このように見てくると、文字を主体とする情報通信の世界がまさに国際技術標準の策定を基盤としてグローバルな発展を始めたのが、ほぼ30年前といえるだろう。
そんなわけで、《文字情報技術の30年》といったシンポジウムみたいなものも、協議会として開催できればいいなあ。
CITPCの15年
先般(2024年9月4日(水))に、コロナ禍などでしばらく途絶えていたCITPC恒例の暑気払いの会が開催された。久々に楽しい歓談はビジネス展開の話も含めて、つきることがなかった。そのおり、事務局をお願いしているエッジプラスの木村社長から、「CITPCも例年でもう15周年なんですよ」と聞かされた。そうか、もう15年か。総会の折の特別講演になるか、別個のセミナーになるかは措くとして、2025年には、何か記念になるイベントをやりたいと思っている。いい機会なので、15周年を目指して、CITPCの15年を振り返っておくのも悪くないだろう。とともに、前からいつかは書きたいと思っていた「ユニコード戦記」と「EPUB戦記」の続編への助走にもしたいし。
一念発起して、事務局の佐藤さんの手を煩わせて、昔の資料をまとめて送っていただいた。以下、その資料を掘り返しつつの、雑感。
2010年12月6日「IVS技術促進協議会」設立総会
一般財団法人文字情報技術促進協議会の前身となる「IVS技術促進協議会」の設立総会が開催された。同日、ニュースリリースも公開された。協議会の設立趣意書。
IVS技術促進協議会設立趣意書
パソコンや各種デジタルデバイス、インターネット、オンラインサービスの普及に伴い、電子出版に見られるように情報の発信者である作者と受信者である読者との距離がこれまでになく近くなっています。しかし、文字には地域、用途によって様々な字体が存在し、現在の多くのコンピューターソフトウェアではこれらを取り扱う事が出来ず、同じ文字を作者と読者が共有する事を保証する事が出来ません。
例えば、住民基本台帳、戸籍には、一般に入力、表示が出来ない字体が多く含まれ、これらの文字はデジタルデータとして広く交換出来ないのが実際です。
「書き手と読み手が同一の文字を見ている」
IVS (Ideographic Variation Sequence)は、これまで困難であった文字入力から、メール・記録媒体による情報の伝送、受信、そして情報の表示・印刷において、常に同じ文字(字体)であることを保証できる仕組みです。また、これにより歴史的・文化的資産の電子書籍化や、電子政府システムを促進するために不可欠な人名、地名の正確な表記を、国際基準に則り、クラウドコンピューティング時代に欠くことのできない相互運用性を担保しながら実現することが可能となります。
IVS技術の実装はまだ緒に就いたばかりですが、IVS技術促進協議会は、オペレーティングシステムからアプリケーションまでのIVS技術を促進することで、字体を含む文字情報の保全を可能にし、相互運用性の向上を実現するための技術啓発、参加企業間での相互運用性検証、事例紹介、そして共同マーケティングまで幅広い活動を予定しています。また、電子政府などの公共システムのオープン化へ環境づくりに対しても貢献していきます。
発起人企業・団体:
l アドビ システムズ 株式会社
l イースト株式会社
l 株式会社ジャストシステム
l 大日本スクリーン製造株式会社
l マイクロソフト株式会社
l 株式会社モリサワ
【本協議会の目的と事業】
[目的]
本協議会は、ユニコード(公的規格としてはISO/IEC 10646)では同一符号位置に統合される文字の異なる字形(グリフ)の使い分け、字体情報の保全が可能な既に標準化されているIVS (Ideographic Variation Sequence)技術についての情報共有、啓発などの活動を通じて、その技術の普及促進と既存システムとの協調に資することを目的とします。
[事業]
上記の目的を達成するため、本協議会では次の事業を行います。
- IVSに関する情報交換と経験交流に関する事業
- IVSに関する普及啓発
- IVSに関する相互運用性の向上に関する事業
- その他本協議会の目的を達成するために必要な事業
- 本協議会は営利を目的とする活動、事業を行わない
詳細については、IVS技術促進協議会規約(案)をご参照ください。
このアーティクルを書くために、ハードディスクを掘っていたら、設立趣意書の原稿と思われるファイルがいくつも出て来た。趣意書の原案を起草したのはどうもぼくのようだ。
この設立総会の折に提案された、役員候補の名簿も見ておこう。
「IVS技術促進協議会」 役員候補
平成 22 年 12 月 6 日 (月)
IVS技術促進協議会 発起人会
会長
三上 喜貴 (長岡技術科学大学教授、ISO/IEC JTC1/SC2国際議長)
副会長
加治佐 俊一 (マイクロソフト株式会社 業務執行役員 最高技術責任者)
村田 真 (国際大学GLOCOMフェロー)
理事
山本 太郎 (アドビ システムズ 株式会社)
下川 和男 (イースト株式会社)
福良 伴昭 (株式会社ジャストシステム)
小林 龍生 (Unicode Consortium)
藤澤 恭平 (大日本スクリーン製造株式会社)
森澤 彰彦 (株式会社モリサワ)
事務局長
田丸 健三郎 (マイクロソフト株式会社 技術統括室 本部長)
エキスパート会員
安岡 孝一 (京都大学東アジア人文情報学研究センター准教授)
師 茂樹 (花園大学准教授)
以上
会長は、当時ISO/IEC JTC1/SC2の国際議長だった三上喜貴さんが引き受けてくださった。三上さんが会長を引き受けてくれたおかげで、IVS技術促進協議会は、スタート時点からある種のステイタスというかレピュテーションを日本の内外から認められる存在になったような気がする。副会長には加治佐俊一さんと村田真。例によって、村田真には《さん》が付かないなあ。付けると、なんだかよそよそしくなってしまってね。 この二人も、今から思うと、素晴らしい布陣だなあ、と。かたや加治佐さんが代表的なグローパルIT企業の日本における最高技術責任者だったのに対し、かたや村田真は若いころからW3CのXMLワーキンググループにグローバルなゼロックスグループを代表して日本人として唯一アクティヴメンバーとして参画し、オリジナルのXML策定に力を振るって勇名を馳せると同時に、そのころはまだ策定の最終段階にあったEPUB3のレコメンデーション化を目指して、辣腕を振るっていた。彼の悪名、おっと、勇名は、日本でよりも、むしろ、グローバルな国際標準化の専門家の間で轟いていた。他の理事やエキスパートも、業種やアカデミーにおける専門分野を超えて、単にIVSという至極専門的なIT技術の一分野に限ることなく、幅広い分野の専門家の参画者を得たことで、この協議会は、とても幸せなスタートを切ることが出来たように思う。 後に、IVS技術促進協議会は、名称を文字情報技術促進協議会と変更することになるが、このチームビルディングを見ると、その萌芽はすでにこの発足時点であったような気がする。
それにしても、IVS技術促進協議会は、どういう経緯で発足に至ったのだろうか(以下次回)。
固有名詞の字体同定
「字形概念と字体概念の関係」「文字集合の独立性」と、符号化文字集合にとって重要な考え方について、述べてきた。最後は、「固有名詞の字体同定」について。
じつは、これって、結構厄介な問題なのだ。
この手の問題を考えるとき、ぼくがいわばバイブルとして参照する豊島正之さんの「JIS批判の基礎知識」を、再度紐解いてみよう。
https://joao-roiz.jp/mtoyo/on-JCS/mt-gene.pdf
固有名詞の典拠性について、下記のような記述がある。
1.1.1 旧 JIS の「文字概念」の語の問題
(前略)
文字の符号化自体は、具象的な図形そのものではなく、その概念上の存在に対して行われるものであり、且つ、 図形文字の概念は、(字義の差は図形差に反映されるという前提の下での) 図形概念に依存しているから、文字概念は、字義 (字の意味・用法) と字の図形概念とが相互に規定しつつ結ばれたもので、つまり、それ自体が記号で ある。
1.1.3 字義の合意 意味の指定は難しいので、字義の合意は、何らかの文献参照で替えられる事が多い。この場合、文献自体に就て の合意があれば参照底本とし易いので、著名な字典、法律、経典等を用いて、これらは既に本文と字体が定まって いるという合意を利用する。(中略) 尚、字義を殆ど欠いた固有名詞では、その名前を持つもの (referent) の存在を参照対象とするしかなく、同定は 時に困難で、「人の名前は本人が違うといったら文字は絶対違う」(坂村健,1997) と、同定を諦める見解も現れる事 になる。
豊島さんのこの部分は、JIS X 0208のいわゆる新旧JIS問題に関連して、《文字概念》について論じたものなので、必ずしも現時点でのぼくの立場と完全に一致しているわけではない。その上で、重要なのは、第一に、
「意味の指定は難しいので、字義の合意は、何らかの文献参照で替えられる事が多い。」この場合、(中略)著名な字典、法律、経典等を用いて、これらは既に本文と字体が定まって いるという合意を利用する。」
という部分。IRGが康煕字典(中華書局版)を典拠の中軸に据えていることは、豊島さんのこの部分の議論に見事に対応する。国際標準化活動としての符号化文字集合という立ち位置(すなわちぼく自身の立ち位置)で、重要なことはこの中華書局版の学術的な正統性云々(このアーティクルで省略した豊島さんの議論)ではなく、標準化活動の主体(ここではISO/IEC JTC1/SC2)として、康煕字典(中華書局版)を典拠の中軸としますよ、と宣言することなのだ。
UCSの統合漢字部分に、各カラムごとに典拠情報が記載されているのも、同じ文脈で理解することが出来る。すなわち、統合漢字として符号化するIdeographは、それぞれの国や地域のauthenticな辞字典類や公的な符号化文字集合規格、そして、公的な文字データベース(文字情報基盤の文字図形を国際提案するに当たって、日本の提案で追加された)など。IRGでの実際の文字同定の作業は、突き詰めると、それぞれの典拠に掲示されている文字相互の同定、ということになる。
そして、もっと重要なのは、後半。
「字義を殆ど欠いた固有名詞では、その名前を持つもの (referent) の存在を参照対象とするしかなく、同定は 時に困難」という部分。
要は、固有名詞の字体の異同については、当事者に聞くしかない、ということ。前々回のアーティクルで詳述したように、符号化文字集合で符号化しているのは、あくまでも抽象的で視覚的に見ることの出来ない字体。なので、ご本人に聞くべき問いかけは、例示字形を手がかりとして「あなたがお名前に使われている字体は、この字体集合の中のどの字体に帰属しますか」といったことになる。
行政事務標準文字に即して、前々回の思考実験(字体に対応する百均の小袋モデル)で考えると。電子化の対象となる行政文書(戸籍や住民票など)に含まれる人名や地名などの固有名詞を構成する文字について、小袋に貼り付けてある字形を頼りに、どの小袋に入れるのが一番適当かを探していくことになる。行政事務の担当者が迷った場合は(本来は迷わなかった場合も)、最終的にはご本人もしくはご遺族などの当事者に確認する必要があろう。
厄介なのは、当事者が、該当する小袋が見つかりません、とおっしゃった場合。
解決策は、二つしか無い。
一つ。字形が一番近そうな小袋を示して、これでいかがですか、と提案して納得してもらう。
一つ。新しい小袋を用意して、該当する字形を小袋に貼り付けて、新たな字体の例示字形とする。当然ながら、後者の事後的な手続きには、膨大な手続きとコストが発生する。
行政事務標準文字は、デジタル庁の担当部署が、各自治体の全面的な協力を得て、戸籍関連文書を中心とする現今の行政文書に現れる人名や地名などの固有名詞に含まれる字形を渉猟した上で、ある一定の粒度で整理統合した字体集合になっているので、後者の可能性は、限りなくゼロに近いだろう。
包摂規準(統合規則)の大切さ
ここまで来れば、考えなければならないことは、案外単純なことだ。
対象となる字形につき、字体を代表(represent)する例示字形とのある一定粒度の類似性のみに拠って、帰属する字体を選ぶこと。
その類似性を具体的に示したのが、他ならぬ包摂規準(統合規則)なのだ。そして、その包摂規準は、字体集合ごとにそれぞれ異なっている。
再び、豊島さんのバイブルを見てみよう。
1.1.4.1 精度規定としての包摂規準 実際に存在する字形は、一回限りの存在であり、二つとして同じ字形は存在しない。こうした存在を符号化する 為には、それらの図形的な差を捨象して、抽象化せねばならない。全ての字形 (加算無限) に符号を振る符号化は、 (理論的には可能だが) 現実的ではなく、「見た目により同一形状の文字は統合する」(坂村健,1996b) のが、符号化 の一般である。 (中略) こうした「捨象」をどの程度まで行うかに就ての合意が「包摂規準」であり、工業規格としての符号化文字集合 では、いわば情報交換の「精度」の規定であると見てよい。
この部分も、包摂概念の記述として、間然とするところがない。
特に、最後の行『情報交換の「精度」の規定』のところ。今までのぼくの議論に引き寄せると、文字集合が異なると(包摂分離が行われると)、包摂の精度が変化するのだ。言い換えると、文字集合が異なれば包摂規準も異なるのだ。ぼく自身は、このような包摂の精度を勝手に字体弁別粒度と呼んでいる。
さらに言えば、包摂規準は、文字集合全体に一律に適用されるものではなく、厳密には、集合の個々の要素となる字体毎に独立しているものなのだ。例を挙げた方が分かりやすいだろう。
たとえば、点のあるなし。JIS X 0213の「6.6.3.2漢字の字体の包摂規準の詳細」を見ると、d)1点画の増減の違いとして、124)大、犬(便宜上、該当する文字そのものを記しているが、実際には、偏や旁などに用いられる校正要素)が掲げられている。そして、
(1-51-26)が掲げられている。CITPCの漢字検索ページの要素図形検索で「戻」をキーとして検索をかけると、
(MJ043010、U+5533、<5533,E0103>と
(MJ043250、U+5533、<5533,E0105)がヒットする。また、
(MJ198250、U+6D66、1-86-83)、
( MJ015472、U+6DDA、1-86-83)もヒットする。
細かく見ていくときりがないが、概ね常用漢字体は点なし、いわゆる康煕字典体が点あり、ということのようだ。ともあれ、ここでの議論は、構成要素として
や
を持っている漢字でも、JISで包摂されたりUCSで統合されるものと、JISで包摂されなかったり、UCSで統合されなかったりするものがある、ということ。構成要素として
や
を持つものの中では見つけられなかったが、前回のアーティクルで議論したように、JISで包摂されながら、UCSでは統合分離されているものもある。(ちなみに、JISで包摂されていないものは、原規格分離の原則を援用して、互換漢字に符合位置を与えている。)
簡単な例を挙げるつもりだったのに、かえってややこしい話になってしまったが。要は、包摂規準や統合規則といっても、全ての漢字に適用されているわけではなく、(標準化活動の当事者の一人としてははなはだ忸怩たるものがあるけれど、)結構いい加減に使われている、ということ。
さてと。気を取り直して、今回のアーティクルの結論めいたことを纏めておこう。
固有名詞に用いられる文字は、辞書や古典籍などの典拠があるわけではないので、字形のみをよりどころにして、対象となる符号化字体集合(前回の議論の文脈では、Annex Aを用いて宣言されたUCSのサブセット)のどの字体に紐付けるかを決定しなければならない。最終的には、当事者に、例示字形をたよりに、より近いと思われる字体を選んでいただくことになる。その際、字体集合の中では同じ字体とみなす字形の相異部分を列挙したリスト(JISでは包摂規準、UCSでは統合規則)が、判断のより所として有用だ。ただし、当事者が、この字体集合の中には、自分の姓を表記する文字(字体)が存在しないと、強固に主張されたときは、面倒でも、しかるべき手続きをとって字体集合そのものへの追加と、その国際標準化をやらなければならない。